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Nuestro propósito original al escribir este libro fue proporcionar un texto para el curso 
universitario de álgebra lineal en el Instituto Tecnológico de Massachusetts. Este curso 
fue diseñado para.la especialidad de matemática en el nivel medio, aun cuando tres cuartas 
partes de los estudiantes eran de otras disciplinas científicas y tecnológicas que iban desde 
el primer año universitario hasta estudiantes avanzados. Esta descripción del auditorio 
del MIT para el texto se conserva, en general, hasta el presente exacta. Los diez años trans- 
curridos desde la primera edición han visto la proliferación de cursos de álgebra lineal a 
través del país, y han brindado a uno de los autores la oportunidad de enseñar la materia 
básica a una variedad de grupos en la Universidad de Brandeis, Universidad de Washington 
(St. Louis) y en la Universidad de California (Irvine). 

Nuestro principal propósito al revisar el Algebra Lineal ha sido incrementar la variedad 
de cursos que pueden ser dictados con ella. Por un lado hemos estructurado los capítulos, 
especialmente los más difíciles, de modo que haya varios puntos terminales a lo largo del 
desarrollo, permitiendo al profesor en un curso de un cuatrimestre o de un semestre ejer- 
citar una cantidad considerable de posibilidades en la elección del tema. Por otra parte 
hemos aumentado la cantidad de material en el texto, de modo que pueda usarse para un 
curso anual intensivo en álgebra lineal e incluso como libro de referencia para matemáticos. 

Los mayores cambios se han hecho en el tratamiento de las formas canónicas y de los 
espacios con producto interno. En el capítulo 6 ya no se comienza con la teoría general 
que fundamenta la teoría de las formas canónicas. Primero se tratan los valores propios 
en relación con los teoremas de triangulación y diagonalización, y luego se prepara el ca- 
mino hacia la teoría general. El capítulo 8 se ha dividido.de modo que el material básico 
de espacios con producto interno y diagonalización unitaria sea seguido por el capítulo 9 
que trata de las formas sesquilineales y de las propiedades más complicadas de los opera- 
dores normales, incluyendo operadores normales en espacios reales con producto interno. 

Se ha hecho también un número de pequeños cambios y perfegcionamientos de la pri- 
mera edición. Pero la doctrina básica que la inspira no ha cambiado. 

No hemos concedido atención particular al hecho de que la mayoría de los estudiantes 
no estén primariamente interesados en matemática, pues creemos que un curso de esta 
disciplina no debe atiborrar de técnicas al estudiante de ciencia, ingeniería o ciencias so- 
ciales, sino procurarle la comprer de los conceptos matemáticos básicos. 
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Por otro lado, Domos conscientes del amplio campo de conocimientos previos que los 
estudiantes debieran tener y, en particular, del hecho de que los estudiantes han tenido 
muy poca experiencia con el razonamiento matemático abstracto. Por esta razón se ha 
evitado introducir demasiadas ideas abstractas muy al comienzo del libro. Además se ha 
añadido un Apéndice que introduce o analiza ideas básicas tales como las de conjunto, 
funciones y relación de equivalencia. Hallamos de mayor utilidad tratar de estas ideas en 
forma independiente, pero aconsejando a los estudiantes leer el Apéndice cuando ellas 
Aparezcan. 

A lo largo del libro se ha incluido una gran variedad de ejemplos de los conceptos im- 
Portantes que aparecen. El estudio de todos los ejemplos es de fundamental importancia 
y tiende a minimizar el número de estudiantes que repiten definiciones, teoremas y demos- 
traciones en orden lógico sin comprender el significado de los conceptos abstractos. Este 
libro contiene también una amplia variedad de ejercicios graduados (alrededor de seis- 
cientos) que varían desde aplicaciones rutinarias hasta otros dirigidos a los mejores es- 
tudiantes. Estos ejercicios pretenden ser una parte importante del texto. 

El capítulo 1 se refiere a los sistemas de ecuaciones y sus soluciones mediante operaciones 
elementales por filas de las matrices. Ha sido nuestra práctica dedicar alrededor de seis 
clases a esta materia. Ello muestra a los estudiantes un bosquejo de los orígenes del álgebra 
lineal y una técnica de cálculo necesaria para comprender los ejemplos de las ideas abstractas 
que aparecen en los capítulos posteriores. El capítulo 2 se refiere a los espacios vectoriales, 
subespacios, bases y dimensión. El capítulo 3 trata las transformaciones lineales, su ál- 
gebra y su representación por medio de matrices, como también, del isomorfismo, de fun- 
ciones lincales y de espacios duales. El capítulo 4 define el álgebra de los polinomios sobre 
un cuerpo, los ideales en tal álgebra y la factorización prima de un polinomio. También 
sobre raíces, fórmula de Taylor y fórmula de interpolación de Lagrange. El capítulo 5 
rrolla los determinantes de matrices cuadradas y el determinante visto como una fun- 
ción alternada n-lineal de las filas de una matriz, para seguir con las funciones multilineales 
en módulos como el anillo de Grassman. Lo referente a módulos coloca el concepto de 
determinante en un marco más amplio y completo que el que usualmente se encuentra en 
textos elementales. Los capítulos 6 y 7 contienen un estudio de los conceptos que son básicos 
para el análisis de una transformación lineal en un espacio vectorial de dimensión finita, 
el análisis de valores propios, las transformaciones triangulables y diagonalizables, los 
conceptos de las partes diagonalizables y nilpotentes de una transformación general y las 
formas canónicas racional y de Jordan. Los teoremas de descomposición primaria y cíclica 
juegan un papel central; a la última se llega a través del estudio de los subespacios admi- 
sibles. El capítulo 7 incluye un análisis de las matrices sobre un dominio polinomial, el 
cálculo de factores invariantes y divisores elementales de una matriz, y el desarrollo de la 
forma canónica de Smith. El capítulo termina con un estudio sobre los operadores semi- 
simples, para completar el análisis del caso de un operador. El capítulo 8 trata con algún 
detalle los espacios con producto interno de dimensión finita y cubre la geometría básica, 
relacionando la ortogonalización con la idea de la «mejor aproximación a un vector» y 
cun los conceptos de proyección ortogonal de un vector sobre un subespacio y el com- 
plemento ortogonal de un subespacio. También trata de los Operadores unitarios, 
y culmina con la diagonalización de operadores autoadjuntos y normales. El capi- 
tulo 9 introduce las formas sesquilineales, las relaciona con los operadores positivos y 
auloadjuntos en un espacio com producto interno, sigue con la teoría espectral de opera- 
dores normales y luego en resultados más complejos relativos a operadores normales en 
espacios reales o complejos con producto interno. El capítulo 10 examina las formas bi- 
lineales, insistiendo en las formas canónicas para las formas simétrica y antisimétrica, así 
como en los grupos que preservan formas no-degeneradas, especialmente los grupos ortos 
fonal, unitario, seudo-ortogonal y de Lorentz 
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Se estima que cualquier curso que use este texto deberá cubrir completamente los ca- 
pítulos 1, 2 y 3 con posible excepción de las secciones 3.6 y 3.7 que se refieren al doble dual 
y a la traspuesta de una trasformación lineal. Los capítulos 4 y 5, sobre polinomios y de- 
terminantes, pueden tratarse con grados diversos de minuciosidad. En efecto, los ideales 
de polinomios y las propiedades básicas de los determinantes pueden cubrirse en forma 
bastante esquemática sin afectar el desarrollo lógico del texto; sin embargo, nos inclinamos 
a tratar estos capítulos cuidadosamente (excepto los resultados referente a módulos), porque 
la materia ilustra muy bien las ideas básicas del álgebra lineal. Un curso elemental puede 
ser ahora concluido elegantemente con las cuatro primeras secciones del capítulo 6, junto 
con el capítulo 8 (nuevo). Si las formas racional y de Jordan han de ser incluidas, es nece- 
'sario abarcar una extensión mayor del capítulo 6. Pr 

Quedamos muy reconocidos a todos aquéllos que contribuyeron a la primera edición, 
especialmente a los profesores señores Harry Furstenberg, Louis Howard, Daniel Kan y 
Edward Thorp, a las señoras Judith Bowers, Betty Ann (Sargent) Rose y a la señorita Phyllis 
Ruby. Queremos además dar las gracias a los numerosos estudiantes y colegas cuyos pene- 
trantes comentarios llevaron a esta revisión, y al personal de Prentice-Hall por su paciencia 
para tratar con dos aut: res atrapados en los laberintos de la administración académica, 
Finalmente, gratitud especial debemos a la señora Sophia Koulouras por su pericia y ago- 
tador esfuerzo en escribir fa máquina el manuscrito revisado. 


K. HOFFMAN y R. KUNZE 
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I. Ecuaciones lineales 


1.1. Cuerpos 


Suponemos al lector familiarizado con el álgebra elemental de los números 
reales y complejos. En una gran parte de este libro las propiedades algebraicas 
de los números que se usarán se deducen fácilmente de la siguiente breve lista 
de propiedades de la adición y de la multiplicación. Se designa por F el con- 
junto de los números reales o el conjunto de los números complejos. 

1. La adición es conmutativa, 

a+y=y+e 
para cualquiera x e y de F. 
2. La adición es asociativa, 
z+ lyt) = (+y) +z 
para cualquiera x, y y z de F. 

3. Existe un elemento único 0 (cero) de F tal que x + 0 = x, para todo 
x en F. 

4. A cada x de F corresponde un elemento único (—x) de F tal que 
x + (—x)=0. 

S. La multiplicación es conmutativa, 

xy = yz 
para cualquiera x e y de F. 

6. La multiplicación es asociativa, 

r(yz) = (xy)z 
para cualquiera x, y y z de F. 
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7. Existe un elemento no nulo único de F tal que xl = x, para todo 
x de F. 

8. A cada elemento no nulo x de F corresponde un único elemento x ' 
(o 1/x) de F tal que xx”! = 1. 

9. La multiplicación es distributiva respecto de la adición; esto es, x(r + 
2) = xy + xz, para cualesquiera x, y y z de F. 


Supóngase que se tiene un conjunto F de objetos x, y, z, ... y dos opera- 
ciones sobre los elementos de F como sigue; la primera operación, llamada 
adición, asocia a cada par de elementos x, y de F un elemento (x + y) de F; 
la segunda operación, llamada multiplicación, asocia a cada par x, y de F un 
elemento xy de F; y estas dos operaciones satisfacen las anteriores condicio- 
nes (1)-(9). El conjunto F, junto con estas operaciones, se llama entonces cuerpo. 
Hablando aproximadamente, un cuerpo es un conjunto, junto con algunas ope- 
raciones sobre los elementos de éste, que se comportan como la adición. sustrac- 
ción, multiplicación y división corrientes de los números en el sentido de que 
obedecen a las nueve reglas del álgebra dadas anteriormente. Con las opera- 
ciones comunes de adición y multiplicación, el conjunto C de los números com- 
plejos es un cuerpo, como lo es el conjunto R de los números reales. 

En la mayor parte de este libro los «números» que se usan pueden ser los 
elementos de cualquier cuerpo F. Para permitir esta generalidad se usará la 
palabra «escalar» en vez de «número». No perderá mucho el lector si siempre 
presupone que el cuerpo de los escalares es un subcuerpo del cuerpo de los 
números complejos. Un subcuerpo de un cuerpo C es un conjunto F de números 
complejos que es a su vez un cuerpo respecto de las operaciones usuales de 
adición y multiplicación de números complejos. Esto significa que el O y el 1 
están en el conjunto F, y que si x e y son elementos de F, también lo son 
(a+ y») —x, xy, ex? (si x 2 0). Un ejemplo de un subcuerpo semejante 
es el cuerpo R de los números reales; en efecto, si se identifican los números 
reales con los números complejos (a + ib) para los que b = 0, el O y el 1 del 
cuerpo complejo son números reales y si x e y son reales, también lo son (x + y). 
=x, xy y x™' (si x + 0). Daremos otros ejemplos más adelante. Lo peculiar 
de los subcuerpos en nuestro estudio es esencialmente lo siguiente: Si se está 
operando con escalares que forman un-cierto subcuerpo de C, entonces la eje- 
cución de las operaciones de adición, sustracción, multiplicación o división 
con estos escalares no se salen del subcuerpo dado. 


Ejemplo 1. El conjunto de los enteros positivos*: 1, 2, 3, . . . no es un sub- 
cuerpo de C por varias razones. Por ejemplo, 0 no es un entero positivo: para 
ningún entero positivo n, es —n un entero positivo; para ningún entero po- 
sitivo n, excepto 1, es 1/n un entero positivo. 


Ejemplo 2. El conjunto de los enteros: ..., —2, —1, 0, 1,2, ..., no es 
un subcuerpo de C, porque para un entero n, 1/n no es entero al menos que 


* El autor liama «enteros positivos» los enteros 1, 2, 3, . . . y excluye el 0. Hoy no es esto asi, 
pues se incluye el O entre los enteros positivos («naturales»). 
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n sea Lo —1. Con las operaciones usuales de adición y multiplicación, el con- 
junto de los enteros satisface todas las condiciones (1)-(9), con excepción de 
la condición (8). 


Ejemplo 3. El conjunto de los números racionales, esto es, números de 
la forma p/q, donde p y q son enteros y q + 0, es un subcuerpo del cuerpo de 
los complejos. La división que no es posible en el conjunto 'de los enteros es 
posible en el conjunto de los números racionales. El lector interesado debería 
verificar que cualquier subcuerpo de C debe contener a todo número racional. 


Ejemplo 4. El conjunto de todos los números complejos de la forma x+ IB 
donde x e y son racionales, es un subcuerpo de C. Se deja al lector la compro- 
bación. 


En los ejemplos y ejercicios de este libro el lector deberá suponer que el 
cuerpo considerado es un subcuerpo de los números complejos, a menos que 
expresamente se establezca que es un cuerpo más general. No queremos volver 
sobre este punto; sin embargo, se debe indicar por qué se adopta tal supuesto. 
Si Fes un cuerpo, es posible a veces sumar la unidad 1 a sí misma un número fini- 
to de veces y obtener 0 (véase el Ejercicio 5 de la siguiente Sección 1.2): 


14+1+---+1=0 


Esto no sucede en el cuerpo de los números complejos (ni en ningún subcuerpo 
suyo). Si ello sucede en F, entonces el menor n, tal que la suma de los n unos 
es 0, se llama: característica del cuerpo F. Si ello no sucede en F, entonces (por 
alguna extraña razón) F se llama un cuerpo de característica cero. A menudo, 
cuando se supone que F es un subcuerpo de C, lo que se quiere garantizar es 
que F es un cuerpo de característica cero; pero, en una primera exposición 
del álgebra lineal, es preferible no preocuparse mucho con respecto a carac- 
terísticas de cuerpos. 


1.2. Sistemas de ecuaciones lineales 


Supóngase que F es un cuerpo. Se considera el problema de encontrar n 
escalares (elementos de F) xy, ..., X, que-satisfagan las condiciones 


Ant + Ante + +: + Amma = Y 
a- Ant + Apto +- + Azntn = Ya 


Arata + Anat + ++: + Ámntn = Ym 


donde yi, ---> Ym Y Aip 1<i<m,1 <j<mn, son elementos de F. A (1-1) se 
le llama un sistema de m ecuaciones lineales con n incógnitas. Todo n-tupie 
(Xis - - - > Xn) de elementos de F que satisface cada una de las ecuaciones de (1-1) 
se llama una solución del sistema. Si y, = y2 = ``“ = Jm = 0, se dice que el 
sistema es homogéneo, o que cada una de ias ecuaciones es homogénea. 


—<— 
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Tal vez, la técnica fundamental para encontrar las soluciones de un siste- 
ma de ecuaciones lineales, es la técnica de eliminación. Se puede ilustrar esta 
técnica en el sistema homogéneo 

24— tt m=0 
Tı + 322 + 4x3 = 0. 


Si sumamos (—2) veces la segunda ecuación a la primera, se obtiene 


—Tx2 — Tx = 0 
O sea, X} = —X3. Si se suma tres veces la primera ecuación a la segunda, se 
obtiene 
Ta+Tx=0 
O sea, xy = —X3. Así, se concluye que si (x1, X2, x3) es una solución entonces 
Xı = X, = —X3. A la inversa, se puede fácilmente verificar que toda terna 


de esa forma es una solución. Así, el conjunto de soluciones consta de todas 
las ternas (—a, —a, a). 

Se han encontrado las soluciones de este sistema de ecuaciones «eliminan- 
do incógnitas», esto es, multiplicando las ecuaciones por escalares y sumándo- 
las luego para producir ecuaciones en las cuales algunas de las x; no están pre- 
sentes. Deseamos formalizar ligeramente este proceso de modo que se pueda 
entender por qué opera y para así poder llevar a cabo los cálculos necesarios 
para resolver un sistema de manera sistemática. 

Para el sistema general (1-1), supóngase que seleccionamos m escalares 
Cis +++ > Cm que se multiplica la j-ésima ecuación por c; y que luego se suma. 
Se obtiene la ecuación 


(An +++ H rán + +++ + (041 + ++ CmAmn)En 
= CY F *** F CY 


Y tal ecuación se la llama combinación lineal de las ecuaciones (1-1). Evidente- 
nente, cualquier solución de todo el sistema de ecuaciones (1-1) será también 
:olución de esta nueva ecuación. Esta es la idea fundamental del proceso de 
sliminación. Si se tiene otro sistema de ecuaciones lineales 


But + +++ + Binta = 4 
(1-2) 7 Se 3 


But + ++ + Bista = Za 


en que cada una de las k ecuaciones sea combinación lineal de las ecuaciones 
de (1-1), entonces toda solución de (1-1) es solución de este nuevo sistema. 
Evidentemente puede suceder que algunas soluciones de (1-2) no sean solucio- 
1es de (1-1). Esto, claro está, no sucede si cada ecuación en el sistema original 
ss combinación lineal de lassecuaciones en el nuevo sistema. Se dirá que dos 
stemas de ecuaciones lineales son equivalentes si cada ecuación de cada sis- 
tema es combinación lineal de las ecuaciones del otro sistema. Podemos en- 
tonces establecer formalmente estas «observaciones como sigue 


A > AAA A 
beuaciones lineales s h 


Teorema 1. Sistemas equivalentes de ecuaciones lineales tienen exactamen- 
te las mismas soluciones. 


Si se quiere que el proceso de eliminación para encontrar las soluciones 
de un sistema como (1-1) sea efectivo, entonces se debe buscar, formando com- 
binaciones lineales de las ecuaciones dadas, cómo se obtiene un sistema equi- 
valente de ecuaciones que sea más fácil de resolver. En la próxima sección se estu- 
diará un método para hacerlo. 


ercicios 


1. Verificar que el conjunto de números complejos descritos en el Ejemplo 4 es un sub- 
cuerpo de C. 


2. Sea F el cuerpo de los números complejos, ¿Son equivalentes los dos sistemas de cot- 
ciones lineales siguientes? Si es así, expresar cada ecuación de cada sistema como com- 
binación lineal de las ecuaciones del otro sistema. 

n1—z=0 31 + x=0 

2x1 + z: = 0 u+zm=0 


3. Examine los siguientes sistemas de ecuaciones como en el Ejercicio 2. 


-n + +4 =0 zn - n=0 
Tı + 322 + 823 = 0 zz + 3z = 0 
+ t: +n = 0 


4. Examine los siguientes sistemas como en el Ejercicio 2. 


2 +(-14+0a Tae (1+5)a + 8e — in u=0 


322 — Rix, + 5x4 = 0 fa — irn t 2+77=0 


5. Sea Fun conjunto que contiene exactamente dos elementos, O y 1. Se define una adición 
y multiplicación por las tablas: 


+|0 1 [ROT 
0/0 1 0/0 0 
111 0 "Li o A 


Verificar que el conjunto F, juntamente con estas dos operaciones, es un cuerpo. 


6. Demostrar que si dos sistemas homogéneos de ecuaciones lineales con dos incógni- 
tas tienen las mismas soluciones, son equivalentes. 


7. Demostrar que todo subcuerpo del cuerpo de los números complejos contiene a todo 
número racional. 


8. Demostrar que todo cuerpo de característica cero contiene una copia del cuerpo de 
los números racionales 


1.3. Matrices y operaciones 
elementales de fila 


No se puede menos de advertir que en la formación de combinaciones linea- 
les de ecuaciones lineales no hay necesidad de seguir escribiendo las «incógnitas» 
Xi» -- -> Xp, ya que realmente solo se opera con los coeficientes A, y los esca- 
lares y;. El sistema (1-1) se abreviará ahora así: 


AX = Y 
donde 

An ++: Árn 

A=| : z 

AA E 
YT Y 
X=|: y Y =| : 
Tn Ym, 


A se llama matriz de los coeficientes del sistema. Estrictamente hablando. la 
disposición rectangular expuesta no es una matriz, smo una representación 
de una matriz. Una matriz m x n sobre el cuerpo F es una función A del con- 
Junto de los pares de enteros (i, j), 1 < i < m, 1 <j <n, en el cuerpo F. 
Los elementos de la matriz A son los escalares Ali, j) = Aj, y, con frecuen- 
cia, suele ser más conveniente describir la matriz disponiendo sus elemen- 
tos en un arreglo rectangular con m filas y n columnas, como antes. Así, 
X (anteriormente) es, o define, una matriz n x 1, e Y una matriz m x 1. 
Por el momento, AX = Y no es más que una notación abreviada del sistema 
de ecuaciones lineales. Más adelante, cuando se haya definido una multipli- 
cación de matrices, querrá decir que Y es el producto de A y X. 

Deseamos ahora considerar operaciones sobre las filas-de la matriz A que 
correspondan a la formación de combinaciones lineales de las ecuaciones del 
sistema AX = Y. Se limitará nuestra atención a tres operaciones elementales 
de filas en una matriz m x n, sobre el cuerpo F: 


1. Multiplicación de una fila de A por un escalar c no nulo; 

2. Remplazo de la r-ésima fila de A por la fila r más c veces la fila s, don- 
de c es cualquier escalar y r Æ s; 

3. Intercambio de dos filas de A. 
Una operación elemental de filas es, pues, un. tipo especial de función (regla) 
e que asocia a cada matriz m x n, A, una matriz m x n, e(4). Se puede des- 
cribir e en forma precisa en los tres casos como sigue: 


1. e(A);= 4y; si ¡4r, e(A),; = CA; 
2. el4)¡= Aj si i+#r, AA), = Ar; + CAs. 


3. e(A)j= Ay; si ies diferente de r y s, e(A),; = Asi, eA); = Aj- 


En la definición de e(4) no es realmente importante cuántas columnas tenga A, 
pero el número de filas de A sí que es decisivo. Por ejemplo, se debe prestar 


sd € 


Fenactones. lineales Pa 


atención a lo que significa intercambiar las filas 5 y 6 de una matriz 5 x 5. Para 
evitar esta clase de complicaciones, convendremos en que una operación ele- 
mental de filas e está definida en la clase de todas las matrices m x n sobre F, 
para algún m fijo, pero para cualquier n. En otras palabras, una e particular 
está definida en la clase de todas las matrices sobre F que tienen 7n filas. 
Una razón por la que nos limitamos a solo estos tres tipos de operaciones con 

es que efectuada una operación e en una matriz A. se puede volver a A 
efectuando una operación semejante en e(A). 


Teorema 2. ‘A cada operación elemental de filas e corresponde una opera- 
ción elemental de filas e,, del mismo tipo de e, tal que e,(e(A)) = ele, (4) = A 
para todo A. Es decir, existe la operación ( función) inversa de una operación 
elemental de filas y es una operación elemental de filas del mismo tipo. 


Demostración. (1) Supóngase que e es la operación que multiplica la r-ésima 
fila de una matriz por un escalar no nulo c. Sea e, la operación que multiplica 
la fila r por c”*. (2) Supóngase que e sea la operación que remplaza la fila r por 
la misma fila r a la que se le sumó la fila s multiplicada por c, r + s. Sea e, la 
operación que remplaza la fila r por la fila r a la que se le ha sumado la fila s 
multiplicada por (—c). (3) Si e intercambia las filas r y s, sea e, = e. En cada 
uno de estos casos es claro que es(e(4)) = ele,(4)) = A para todo A. |] 

Definición. Si A y B son dos matrices m x n sobre el cuerpo F, se dice que 
B es equivalente por filas a A si B se obtiene de A Por una sucesión finita de opera- 
ciones elementales de filas. 


Usando el Teorema 2, el lector encontrará fácil verificar lo siguiente: Cada 
matriz es equivalente por filas a ella misma; si B es equivalente por filas a A, 
entonces A es equivalente por filas a B; si B es equivalente por filas a 4 y C es 
equivalente por filas a B, entonces C es equivalente por filas a A. O sea, que 
la equivalencia por filas es una relación de equivalencia (véase Apéndice). 


Teorema 3. Si A y B son matrices equivalentes por filas, los sistemas ho- 
mogeneos de ecuaciones lineales AX = 0 y BX = 0 tienen exactamente las mismas 
soluciones. 


Demostración. Supóngase que se pasa de A a B por una sucesión finita 
de operaciones elementales de filas: 


A = Ay > A, > *::—> A, = B. 


Basta demostrar que los sistemas A;X =0 y Aj+1X = 0 tienen las mismas 
soluciones, es decir, que una operación elemental por filas no altera el conjun- 
to de soluciones. 

Así, supóngase que B se obtiene de 4 por una sola operación elemental 
de filas. Sin que importe cuál de los tres tipos (1), (2) o (3) de operaciones sea, 
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cada ecuación del sistema BX = 0 será combinación lineal de las ecuaciones 
del sistema AX = 0. Dado que la inversa de una operacion elemental de filas 
es una operación elemental de filas, toda ecuación de AX = 0 será también 
combinación lineal de las ecuaciones de BX = 0. Luego estos dos sistemas 
son equivalentes y, por el Teorema 1, tienen las mismas soluciones. | 


Ejemplo 5. Supóngase que F es el cuerpo delos números racionales 
2 -—1 3 2 
A=|1 4 0 —1| 
2 6 —1 5 


Se efectuará una sucesión finita de operaciones elementales de filas en 4, in- 
dicando con números entre paréntesis el tipo de operación realizada. 


A 0-9 3 4 
II O E ES Y e 
Ue E E a he 5 
O 4 O ES 4 
L a O E RL o 1 
USE 107 N 
A A: i 0. 0 4 -a 
o A A O EN 
e e cd 
0.0 1-4 o 0d Y 
de o Ear lila 0 00 ls 
0. 1. 4-1 0 1 4 4 
001 4% 
100 + 
AO E: 


La equivalencia por filas de A con la última matriz en la sucesión anterior nos 
indica en particular que las soluciones de 


2x1 — qt: + 3z; + 2r; = 0 
ti + 4x2 — n=0 
201 + 6x2 — mi + 5r, = 0 


T — La = 0 
Tı +n =0 
T2 — ġnu=0 

son exactamente fas mismas. Queda de manifiesto en el segundo sistema que, 


si asignamos a x, un valor racional c cualquiera, se obtiene una solución 
(Yo, e, Le, e), con lo que toda solución es de esta forma 


Ecuaciones lineales d t aaia i e 


Ejemplo 6. Supóngase que es F el cuerpo de los números complejos y 


2i i 
A=|-i 31 
1.2 


Al efectuar operaciones con filas es conveniente a menudo combinar varias 
operaciones del tipo (2). Teniendo esto presente 


—1 4 0 2+: 0 1 0 1 
—i 3|%/0 342/00 3+2/|2%]/0 oj 
1 2 1 2 1 2 10 
Con lo que el sistema de ecuaciones 
—u + ix =0 
—ix + 302 = 0 
a +2 = 0 


tiene solamente la solución trivial x, = x, = 0. 


En los Ejemplos 5 y 6 obviamente no se estaban haciendo operaciones con 
filas al azar. La elección de las operaciones con filas estaba motivada por el 
deseo de simplificar la matriz coeficiente de una manera análoga a la «elimi- 
nación de incógnitas» en el sistema de ecuaciones lineales. Daremos ahora una 
definición formal del tipo de matriz a la que estábamos tratando de llegar. 


Definición. Una matriz m x n, R, se llama reducida por filas si: 


(a) el primer elemento no nulo de cada fila no nula de R es igual a 1; 
(b) cada columna de R que tiene el primer elemento no nulo de alguna fila: 
tiene todos sus otros elementos Ù. 


Ejemplo 7. Un ejemplo de matriz reducida por filas es la matriz identidad 
n x n (cuadrada) Z. Esta es la matriz n x n definida por 
HAS ido 
Ly = 04 = E si i#j. 
Esta es la primera de las muchas ocasiones en que se usará la delta de 
Kronecker (ô). 


En los Ejemplos 5 y 6 las matrices finales obtenidas son matrices reduci- 
das por filas. Dos ejemplos de matrices no reducidas por filas son* 


1 0 0 0 0 2 1 
0 1 -1 0) 1 0 —34 
0 0 10 0 0 0 


La segunda matriz no satisface la condición (a), porque el primer elemento 


o as. ct O. cc ds cd. E —_—_— — e 
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no nulo del primer renglón no es 1. La primera matriz sí satisface la condición 
(a), pero no la condición (b) en la columna 3. 

Demostraremos ahora que se puede pasar de cualquier matriz dada a una 
matriz reducida por filas, por medio de un número finito de operaciones ele- 
mentales de fila. Esto, junto con el Teorema 3, proporcionará un instrumento 
efectivo para la resolución de sistemas de ecuaciones lineales. 


Teorema 4. Toda matriz m x n sobre el cuerpo F es equivalente por filas 
a una matriz reducida por filas. 


Demostración. Sea A una matriz m x n sobre F. Si todo elemento de la 
primera fila de A es 0, la condición (a) se cumple en lo que concierne a la fila 1. 
Si la fila 1 tiene un elemento no nulo, sea k el menor entero positivo j para el 
que A; + 0. Multiplicando la fila 1 por Az la condición (a) se cumple con 
respecto a esa fila. Luego, para todo ¡ > 2, se suma (—A;,) veces la fila 1 a la 
fila i. Y ahora el primer elemento no nulo de la fila 1 está en la columna k, ese 
elemento es 1, y todo otro elemento de la columna k es 0. 

Considérese ahora la matriz que resultó de lo anterior. Si todo elemento 
de la fifa 2 es 0, se deja tal cual. Si algún elemento de la fila 2 es diferente de 0, 
se multiplica esa fila por un escalar de modo que el primer elemento no nulo 
sea 1. En el caso de que la fila 1 haya tenido un primer elemento no nulo en la 
columna k, este primer elemento no nulo de la fila 2 no puede estar en la colum- 
na k; supóngase que esté en la columna k, + k. Sumando múltiplos apropia- 
dos de la fila 2 a las otras filas, se puede lograr que todos los elementos de la 
columna k, sean 0, excepto el 1 en la fila 2. Lo que 'es importante observar es 
lo siguiente: Al efectuar estas operaciones, no se alteran los elementos de la 
fila 1 en las columnas 1, ..., k, ni ningún elemento de la columna k. Es claro 
que, si la fila 1 era idénticamente nula, las operaciones con la fila 2 no afectan 
la fila 1. 

Si se opera, como se indicó, con una fila cada vez, es evidente que después 
de un número finito de etapas se llegará a una matriz reducida por filas. Ẹ 


Ejercicios 
1. Hallar todas las soluciones del sistema de ecuaciones 


(1 — da — iz: = 0 
221 + (1 — i)z: = 0. 


3 —1 2 
A=|2 11 
1—_30 


hallar todas las soluciones d2 AX = 0 reduciendo A por filas. 


3. Si 
6 -4 0 
[2230] 
=i 0 3 


cds T e aai a ción ds e —> Y Lad 


Ecuaciones lineales 


hallar todas las soluciones de AX = 2X y todas las soluciones de AX = 3X (cl símbolo 
cX representa la matriz , cada elemento de la cual es c veces el correspondiente elemen- 
to de X). 


4. Hallar una matriz reducida por filas que sea equivalente por filas a 


a taton 0 
Aa=|1 -2 11 
1 2i 2 


5. Demostrar que las siguientes dos matrices no son equivalentes por filas 
2 00 Al 2 
i -1 0|p =2 0 —IT 
b e 3 1 3 5. 


cd 


una matriz 2 x 2 con elementos complejos. Supóngase que A es reducida por filas y tam- 
bién que a + b + c + d = 0. Demostrar que existen exactamente tres de estas matrices. 


7. Demostrar que el intercambio de dos filas en una matriz puede hacerse por medio 
de un número finito de operaciones elementales con filas de los otros dos tipos. 


8. Considerar el sistema de ecuaciones AX = 0, donde 
a b 
eS [i d 
es una matriz 2 x 2 sobre el cuerpo F. Demostrar lo siguiente: W 
(a) Si todo elemento de A es 0, entonces cada par (x1, x2) es una solución de AX = 0. 
< (b) Siad — bc + 0, el sistema AX = 0 tiene solamente la solución trivial x; = x, = 0.* 
(c) Si ad — bc = 0 y algún elemento de A es diferente de (), entonces existe una solu- 


ción (x9, x9) tal que (x,, x2) es una solución si, y solo si, existe un escalar y tal que x, = 
0 o 
YX1)> X2 = YX2- 


1.4. Matrices escalón reducidas por filas 


Hasta el momento, el operar con sistemas, de ecuaciones estaba motivado 
por tratar de encontrar las soluciones de tal sistema. En la Sección 1.3 se esta- 
bleció un método normal de encontrar esas soluciones. Queremos ahora ad- 
quirir alguna información algo más teórica, y para tal propósito es conveniente 
profundizar un poco más en las matrices reducidas por fila. 


Definición. Una matriz m x n, R, se llama matriz escalón reducida por 
fila si: 

(a) R es reducida por filas; ) 

(b) toda fila de R que tiene todos sus elementos 0 está debajo de todas las 
filas que tienen elementos no nulos; 
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G) si las filas 1, ro son las filas no nulas de R, y si el primer elemento 
no nulo de la fila i está en la columna k;, i = 1, . . . ,r,entocesky < k, < +- < k 
SS 


i Se puede describir también una matriz escalón R reducida por filas como 
sigue. Todo elemento de R es 0, o existe un número positivo r, | < r < m, y 
r enteros positivos k,, ..., k, con L<k;<ny Ais 


(a) Ry = 0 para i>r, y Rj =0 si j < k; 
(b) Ri, = Ójj 1 <i<r,1<j<r. 
Ck, <-** <Kk,. 


Ejemplo 8. Dos ejemplos de matrices escalón reducidas por filas son la 
matriz identidad n x n y la matriz cero m x n, 0””, cuyos elementos son todos 0. 


El lector no tendrá dificultad en hallar otros ejer plos, pero quisiéramos dar 
q a 


Omo 
O Nne 


Teorema 5. Toda matri ji 
. iz m x n, A, es equivalente por filas i 
T ra k qui por filas a una matriz 


A Demostración. Sabemos que A es equivalente por filas a una matriz re- 
ucida por filas. Todo lo que se necesita observar es que, efectuando un nú- 
mero finito de intercambios de filas en una matriz reducida por filas, se la 

de llevar a la forma escalón reducida por filas. [PJ í A 


] En los Ejemplos 5 y 6 se vio la importancia que tienen las matrices red 
cidas por filas en la resolución de sistemas homogéneos de ecuaciones lineal 2: 
Sea ahora examinar brevemente el sistema RX = 0, donde R es una a 
escalón reducida por filas. Sean las filas 1, .. ., r las no nulas de R, y supóngase 
que el elemento principal no nulo de la fila į está en la columna ka e 
RX = 0 consta entonces de r ecuaciones no triviales. Además, la incógnita x, apa- 
recerá (con coeficiente no nulo) solamente en la ¡-ésima ecuación. Si u ps 
representan las (n — r) incógnitas que son diferentes de x, q Le A 
ces las r ecuaciones no triviales de RX = 0 son de la toca pa 


Ta + z Cijuj=0 
(1-3) i$ z 


Tk, + 2 Cju; = 0. 
j= 


hos las soluciones del sistema de ecuaciones RX = 0 se obtienen dando 
a Al E As SIA Y calculando entonces los correspondientes 
es de Xy,» - - -> xy, de (1-3). Por ejemplo, si R es la matriz del Ejemplo 8. 


Ecuaciones lincales ad 


entonces r = 2, k, = 2, k, = 4 y las dos ecuaciones no triviales del sistema 
RX = 0 son 
t: — 3z +im=0 o xo = 3ra — 5% 
ta + 2r =0 0 t4 = —2%. 


Así, podemos asignar cualquier valor a X1, X3 Y Xs, digamos x, = 4, x3 = b, 
xs = c, y obtener la solución (a, 3b — lc, b, —2c, c). 

Observemos una cosa más, en relación con el sistema de ecuaciones RX = 0. 
Si el número r de filas no nulas de R es menor que n, entonces el sistema RX = 0 
tiene una solución no trivial, esto es, una solución (xı, - -> Xn) €n que no todo 
x, es 0. En efecto, como r < n, se puede clegir algún x; que no esté entre las 
r incógnitas Xp,» -- -> Xk Y Se puede entonces construir una solución como 
antes, en que este xj es 1. Esta observación nos lleva a uno de los hechos más 
fundamentales sobre sistemas homogéneos de ecuaciones lineales. 


Teorema 6. Si A es una matriz m X n con M < M, el sistema homogéneo 
de ecuaciones lineales AX = 0 tiene una solución no trivial. 


Demostración. Sea R una matriz escalón reducida por fila que sea equiva- 
lente por fila a A. Entonces los sistemas AX = 0 y RX = 0 tienen las mismas 
soluciones por el Teorema 3. Si r es el número de filas no nulas de R, entonces 
ciertamente r < m, y como m < n tenemos que r < A. Se sigue inmediatamente 
de las observaciones anteriores que AX = 0 tiene una solución no trivial. |] 


Teorema 7. Si A es una matriz n x n (cuadrada), A es equivalente por 
filas a la matriz identidad n x n, si, y solo si, el sistema de ecuaciones AX=0 
tiene solamente la solución trivial. 


Demostración. Si A es equivalente por filas a I, entonces AX=0 e IX=0 
tienen las mismas soluciones. Recíprocamente, supóngase que 4X = 0 tiene 
solamente la solución trivial ¥ = 0. Sea R una matriz escalón reducida por 
filas n x n, que es equivalente por filas a 4, y sea r el número de filas no nulas 
de R. Entonces RX = 0 carece de solución no trivial. Con lo que r > n. Pero 
como R tiene n filas, ciertamente r < n. Con lo que r = n. Como esto quiere 
decir que R tiene un 1 como primer elemento no nulo en cada una de sus n filas 
y como estos 1 están en las diferentes columnas n, R debe ser la matriz identi- 
dadn xn. I 


Preguntémonos ahora qué operaciones elementales de fila hay que hacer para 
resolver un sistema de ecuaciones lineales AX = Y no homogéneo. De entrada 
cabe observar una diferencia básica con el caso homogéneo; y es que mien- 
tras el sistema homogéneo siempre tiene la solución trivial x, = `+ = Xa = 0, 
un sistema no homogéneo no tiene necesariamente solución. 

Se construye la matriz aumentada A' del sistema AX = Y. Esta es la matriz 
m x (n + 1) cuyas primeras n columnas son las columnas de A y cuya última 
columna es Y; más precisamente, 

Ay= Ai si GEN 
Ain+n = Yi 


AAA AA. AAA E. AA AAA AECA AA. Le - AAA A sd. dd. 
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Supóngase que se efectúa en A una sucesión de Operaciones elementales con 
filas, para llegar a una matriz escalón reducida por filas R. Si se efectúa esta 
misma sutesión de operaciones de fila en la matriz aumentada A ”, se llegará 
a una matriz 'R' cuyas primeras columnas son las columnas de R y cuya última 
columna tiene ciertos escalares z,, ..., Zm. Los escalares z; son los elementos 
de la matriz m x 1 


que resulta de la aplicación de la sucesión de operaciones de fila a la matriz Y. 
Para el lector es claro que, al igual que en la demostración del Teorema 3, los 
sistemas AX = Y y RX = Z son equivalentes y, como consecuencia, tienen 
las mismas soluciones. Es muy fácil determinar cuándo el sistema RX = Z 
tiene alguna solución y encontrar todas las soluciones si es que existen. En efec- 
to, si R tiene r filas no nulas, con el primer elemento no nulo en la fila į y en 


la columna k;, i= 1, ..., r, entonces las primeras ” ecuaciones de RX = Z 
expresarán efectivamente las xp, ..., Xy, por las (n — r) restantes x; y los es- 
calares z,, ..., z,. Las últimas (m — r) ecuaciones son 

0 = zn 

O= zm 


y, por tanto, la condición para que el sistema tenga una solución es z, = 0 
para i > r. Si se cumple esta condición todas las soluciones del sistema se en- 
contrarán, del mismo modo que en el caso homogéneo, dando valores arbi- 
trarios a (n — r) de las Xj, calculando luego x, en la ¡-ésima ecuación. 


Ejemplo 9. Sea F el cuerpo de los números racionales y 


1952 1 
A=|2 1 1 
0 5 —1 


Se trata de resolver el sistema AX = Y para ciertos Vs, Y2 € ya. Efectuando una 


o de operaciones de fila en la matriz aumentada A', que reduzca por 
sad: 


a aA MA a? 

2 1 1g9¡(Sf0 5-1 4-Ww|2 

0 5 —1 Y 0 3 rl Ya 

1 -2 1 Y 1 -2 1 YU 

0 5 -1 (Ye —-241) D O TOS -2 [2 
0 0 0 (n — u+ 2m) 0 0 0 (a — y +2) 


10 $ a +2) 
0 1 -¿ (m — 2y) 
00 O (Y — Yo + 2y) 


AAA Ay]; ñT>T*áñ3ñáII]* > TE_]j]l>e 8 


Ecuactones lineales 15 


La condición para que el sistema AX = Y tenga una solución es, pues, 
2 — Ya + Ya =0 
y si los escalares dados y; satisfacen esta condición, todas las soluciones se ob- 
tienen asignando un valor ce a x3, y calculando luego 
a = —$0 + HY + 242) 
22 = $e + ¿(Y — 2y). 


Una observación final respecto al sistema AX = Y. Supóngase que los ele- 


mentos de la matriz A y los escalares y,, ..., Ym pertenecen a un subcuerpo 
F, del cuerpo F. Si el sistema de ecuaciones AX = Y tiene una solución con 
Yiw «<=, A, En F, tiene también una solución con xj, .. ., X, en F,. En efecto, 


sobre cualquier cuerpo, la condición para que el sistema tenga una solución 
es que se cumplan ciertas relaciones entre los y,, ..., y, €n F, (las relaciones 
, = 0 para i > r anteriores). Por ejemplo, si AX = Y es un sistema de ecua- 
ciones lineales, en el cual los escalares y, y A; son números reales, y si existe 


una solución en que X;, .... X, son números complejos, entonces existe una 
solución en que los xy, ..., X, son números reales. 
Ejercicios 


1. Hallar, mediante reducción por filas de la matriz de coeficientes todas las soluciones 
del siguiente sistema de ecuaciones: 


ha + 2z: — 6 =0 
—421 + 5 =0 
—32, + 6x2 — 1323 = 0 
—Ja + 2r2— ¿au = 0 


2. Hallar una matriz escalón reducida por filas que sea equivalente a 


1 ~i 
A=|2 2 | 
i 1+1 


¿Cuáles son las soluciones de AX = 02 


3. Describir explícitamente todas las matrices escalón 2 x 2 reducidas por filas. 
4. Considérese el sistema de ecuaciones 

tı— t: + 2r =1 

27, + 2% =1 

Tı — 322 + 4x3 = 2. 
¿Tiene este sistema solución? Si es así, determinar todas sus soluciones. 


5. Dar un ejemplo de un sistema de dos ecuaciones lineales con dos incógnitas que no 
tenga solución. 
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6. Mostrar que el sistema 


tı — 2r: + z3 + 2m =1 

nt m— nt 4-2 

ti +t Tr — 5n — n=3 
no tiene solución. 


7. Hallar todas las soluciones de 


2x1 — 312 — 7x3 + 524 + 225 
Tı — 2x2 — 4034 3ta + Ts 
221 — int 2044 t 
Tı — De — Taa + 6x4 + 225 


3 —1 2 
A=|2 1 11h 
1-3 0 


¿Para cuáles ternas (y,, 2, y3) tiene una solución el sistema AX = Y? 
9. Sea 


Mono 


l 
wo 


3-62 =1 
ra dd ll 
0. 011 
1-21 0 


¿Para cuál (y1, Y2, Y3, Ya) tiene solución el sistema de ecuaciones AX = Y? 


10. Supóngase que R y R' son matrices escalón 2 x 3 reducidas por filas y que los sis- 
temas RY = 0 y R'X = 0 tienen exactamente las mismas soluciones. Demostrar que R = R’. 


1.5. Multiplicación de matrices 


Es evidente (o debería serlo, en todo caso) que el proceso de formar com- 
binaciones lineales con las filas de una matriz es fundamental. Por esta razón 
es de provecho introducir un esquema sistemático que indique qué operaciones 
se han de realizar; más precisamente, supóngase que B es una matriz n x p 
sobre el cuerpo F, con filas f,, . . . , Pa y que a partir de B se construye una ma- 
triz C con filas y,, ..., Ym, efectuando ciertas combinaciones lineales 


(1-4) Yi = Aabi + Aabe + --- + Ann 


Las filas de C quedan determinadas por los mn escalares A;,, que son los ele- 
mentos de una matriz m x n, A. Si se desarrolla (1-4) 


(Ca: di Cip) z 2 MiBa: i -AirBrp) 
se ve que los elementos de C vienen dados por 


Ci = 2 AiB,- 


Ecuaciones lineales 
Definición. Sea A una matriz m x n sobre el cuerpo F y sea B una matriz 
n x p sobre F. El producto AB es la matriz m x p, C, cuyos elementos i, j son 
n 
Ci = Y AiB. 
r-1 


Ejemplo 10. He aquí algunos productos de matrices de elementos ra- 
cionales. 


o [e z al-l Us ~ s 


Donde 
n=(6 -1 )=1:(6 -1 2+0- (15 4 8) 


yv=0 7 2)=—3(5 -1 2)+1-(15 4 8) 
0 6 1 10 
el ee >) 
(b) 12 62 —3|7| 5 ajla 8 -2 
3 8 -2 01 


Donde 
m=(9 12 -8)=-20 6 1)+38 8 -2 
ms =(12 62 —-3)= 50 6 1D+48 8 -2 


6 [25] -Es ale] 
a [5 lae a 


= 


Donde 
y =(6 12 =3Q 4) 
© ge a[75]-00 
o 1 opl -5 2 2 
(0 0 0 0/12 3 4|=]/0 
3 0 0 oj|9 —1 3 0 


one DON 
oo» 
—— 


r- 2]fo 1 0] fo 
2 3 4|o o o|=|o0 
De 9 -1 3JLo o o] Lo 


Es importante observar que el producto de dos matrices puede no estar 
definido; el producto está definido si, y solo si, el número de columnas de la 
primera matriz coincide con el número de filas de la segunda. Así que no tiene 
sentido intercambiar el orden*de los factores en (a), (b) y (£) de los ejemplos 
anteriores. Frecuentemente se escribirán productos, tales cuo AB, sin men- 
cionar explícitamente las dimensiones de los factores, y en tales casos se dará 
por entendido que el producto está definido. Por (d), (e), (f), (g) se ve que, aun- 


17 A 


a ASAS ADA A AAA a «dic T di E AA cs. 
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que los productos AB y BA estén definidos, no es necesariamente AB = BA; 
es decir, la multiplicación de matrices no es conmutativa. 


Ejemplo 11. 


(a) Si I es la matriz identidad m x m y A es una matriz m x n, IA = A. 
(b) Si I es la matriz identidad n x n y A es una matriz m x n, Al = A. 
c) SiU*" es la matriz nula k x m, 0%" = 0%"A, En forma similar. A0" ” = oe 
Ejemplo 12. Sea A una matriz m x n sobre F. La representación abre- 


viada anterior AX = Y, para sistemas de ecuaciones lineales, es compatible con 
la definición de productos de matrices. Así, si 


Tn 


Ym, 
tal que y; = Aj¡X, + Ai2X2 + + AinXn- 
El uso de matrices columna sugiere una representación que es frecuente- 


mente útil. Si 8 es una matriz n x p, las columnas de B son las matrices n x 1. 
Bi, ..., B,, definidas por 


By Y 
Bj=| n, 1<jS<p. 
Br; 


La matriz B es la sucesión de estas columnas: 
B=[B,, . . ., Ba). 


El elemento į, j de la matriz producto AB se forma a partir de la i-ésima fila 
de A y de la ¡ésima columna de B. Compruebe el lector que la j-ésima co- 
lumna de AB es AB;: 


AB = [AB, . . . , AB]. 


A pesar de que un producto de matrices depende del orden en que los fac- 
tores están escritos, es independiente del modo en que están asociados, comc 
lo demuestra el siguiente teorema. 


Teorema 8. Si A, B, C son matrices sobre el cuerpo F, tales que los produc- 
tos BC y A(BC) están definidos, entonces también lo están los productos AB, 
(AB)C y 

A(BC) = (ABJC, 


el A E di d 


lineales 19 


Demostración. Supóngase que B es una matriz n x p. Como BC está de- 
limida, C es una matriz con p filas, y BC tiene a filas. Como A(BC) está definida, 
te puede suponer que A es una matriz m x n. Así el producto AB existe y es 
una matriz a x p, de lo que se sigue que el producto (AB)C existe. Para hacer 
ver que A(BC) = (AB)C se debe demostrar que 


[A(BC)]; = [(AB)C];5 
para todos los j, j. Por definición 
[A (BC) ];; 


z 


r 


BO)»; 


ll 
“M 


A 
Ar Y Balaj 
a 
AmBrCoj 
s 


[j 
~M 


AirBraCsj 


1 
eM 
“M 


= Y (2 ABr)Co; 


= 3 (AB) Co; 


= [(AB)C];. Y 


Si A es una matriz (cuadrada) n x n, el producto 44 está definido. Esta 
matriz se representa por A?. Por el Teorema 8, (44)4 = A(A4) o A?A = A4?, 
de modo que el producto 444 está definido sin ambigúedad. Este producto 
se representa por A?. En general, el producto 44 + + A (k veces) está defini- 
do sin ambigúedad, y se representará por 4*. 

Obsérvese que la relación A(BC) = (4B)C implica, entre otras cosas, que 
combinaciones lineales de combinaciones lineales de filas de C son otra vez 
rombinaciones lineales de filas de C. 

Si B es una matriz y C se obtiene a partir de B por medio de una operación 
elemental de filas, entonces toda fila de C es combinación lineal de las filas de 
B, y, por tanto, existe una matriz A tal que AB = C. En general, existen muchas 
de estas matrices A, y entre todas ellas es conveniente y posible escoger una que 
tenga algunas propiedades especiales. Antes de ver esto se necesita introducir 
una clase de matrices. 


Definición. Una matriz m x m se dice matriz elemental si se puede obtener 
de la matriz identidad m x m por medio de una sola operación elemental simple 
de filas. 


Ejemplo 13. Una matriz elemental 2 x 2 es necesariamente una de las 


siguientes: 
[i 1 [o A [i i] 
1 of o af c 1 
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c 0 10 
E i} c0, E Ai c%0. 


Teorema 9. Sea e una operación elemental de fila y sea E la matriz ele- 
mental m x m, E = e(l). Entonces, para toda matriz m x n, A 


e(4) = EA. 


Demostración. La clave de la demostración radica en que el elemento 
de la ¡¿ésima fila y la f-ésima columna de la matriz producto EA se obtiene de 
la ¡-ésima fila de E y de la j-ésima columna de A. Los tres tipos de operaciones 
elementales de fila deben ser estudiados separadamente. Se dará una demos- 
tración detallada para una operación del tipo (ii). Los otros dos casos, más 
fáciles de estudiar, se dejan como ejercicios. Supóngase que r + s y que e es 
una operación que «remplaza la fila r por la fila r más c veces la fila s'». Entonces 


r, 1AT 
Es =42 y 
Véa + cba 1 


tl 
A 


Luego 
IN EAn Ar 
Gajus 2 Patlu = Arny FCAs i=r. 
Es decir, EA = e(4). U 


Corolario. Sean A y B dos matrices m x n sobre el cuerpo F. Entonces 
B es equivalente por filas a A si, y solo si, B = PA, donde P es un producto de 
matrices elementales m x m. 


Demostración. Supóngase que B = PA, donde P = E,- E,E, y los E; 
son matrices elementales m x m. Entonces E,A es equivalente por filas a A, y 
E,(E,A) es equivalente por filas a E, A. Luego E,£,A es equivalente por filas a 
A, y continuando de este modo se ve.que (E, +- E,)A es equivalente por filas 
a A. Sean E,, Ez, ..., E, matrices elementales correspondientes a cierta su- 
cesión de operaciones elementales de filas que lleva 4 a B. Entonces B = 
(E, >> EA. U 


Ejercicios č 


a=|; 3 1) B-f 1) Gaiei: 


1 


L Sean 


Calcular ABC y CAB. 
2. Sean 


ti 
o y 

l 
pony 


fl -1 1 
pla 01 B 
3 01 


Verificar directamente que A(AB) = A?B. 


AA ~ BE - EF 


Ecuaciones lincates 2 


2. Encontrar dos matrices 2 x 2, A. diferentes tales que 42 = 0, pero A + 0, 


4, Para cada A del Ejercicio 2, hallar matrices elementales £, E), ...., E, tales que 


Er -+ EJEA = L. 


REEE 


¿Existe una matriz C tal que CA = B? 


4, Scan 


6 Sea A una matriz m x n y B una matriz n x k. Demostrar que las columnas de C = AB 
son combinaciones lineales de las columnas de A. Si œ, .... a, son las columnas de A y 
Jı- «--+ Y son las cdlumnas de C, entonces 


n 
Yi= Y Bar. 


r=] 


7 Scan A y B matrices 2 x 2 tales que AB = I. Demostrar que BA = I. 


Cu Ci 
c=[c: €] 


una matriz 2 x 2. Se desea saber si es posible encontrar matrices 2 x 2, A y B, tales que 
C = AB — BA. Demostrar que tales matrices pueden hallarse si, y solo si, Ci, + C22 =0. 


B. Sea 


1.6. Matrices inversibles 


Supóngase que P es una matriz m x m, que es un producto de matrices 
elementales. Para cada matriz m x n, A, la matriz B = PA es equivalente por 
filas a A; luego A es equivalente por filas a B y existe un producto Q de matri- 
ves elementales, tal que 4 = QB. En particular, esto es verdad cuando A ọs la 
matriz identidad m x m. En otras palabras, existe una matriz m x m, Q, que 
es ella misma un producto de matrices elementales, tal que QP = 1. Como 
veremos, la existencia de una Q con QP = I es equivalente al hecho de que 
P es un producto de matrices elementales. 


Definición. Sea A una matriz (cuadrada) n x n sobre el cuerpo F. Una 
matriz n x n, B, tal que BA = I se llama inversa a la izquierda de A; una matriz 
n x n, B, tal que AB = I se llama inversa a la derecha de A. Si AB = BA = I, 
entonces B se llama inversa bilátera de A, y se dice que A es inversible. 


Lema. Si A tiene una inversa a la izquierda, B, y una inversa a la derecha, 
C, entonces B = C. 


Demostración. Supóngase que BA = I y que AC = I. Entonces 


B = BI = B(AC) = (BA)C = IC =C. | 


A A A E cid. d 
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Así, si A es inversa a la izquierda e inversa a la derecha, A es inversible y 
tiene una inversa bilátera que se representará por 4”! y se llamará simplemente 
la inversa de A. 

Teorema 10. Sean A y B dos matrices n x n sobre F. 


G) Si A es inversible, también lo es A7* y (A'Y * = A. Y 
(ii) Si A y B son inversibles, también lo es AB y (ABY ' =B"'4”". 


Demostración. La primera afirmación es evidente por la simetría de la 
definición. La segunda se desprende de las relaciones 


(AB/B-142) = (BIAN(AB) = 1. I 
Corolario. Un producto de matrices inversibles es inversible. 


Teorema 11. Una matriz elemental es inversible. 


Demostración. Sea E una matriz fundamental correspondiente a la ope- 
ración elemental de fila e. Si e, es la operación inversa de e (Teorema 2) y E, = 
e, (2), entonces 


BE, = e(E) = elex(1)) = 1 
nE =e(E) = ele(1)) = I 
con lo que E es inversible y E, = £”*. | 


Ejemplo -14. 
o A 

0) both 
o Le al toa 


(d) Cuando c + 0, 


c op _ fe o [i a arid, 
k = [5 e Y lo el “lo e: 


Teorema 12. Si A es una matriz n x n, los siguientes enunciados son equi- 
G 
valentes. 


(i) 4 es inversible. : 
(ü) A es equivalente por filas a la matriz identidad n x n 
(iii) A es un producto de matrices elementales. 


Js es 
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Demostración. Sea R una matriz escalón reducida por filas, equivalen- 
le por filas a 4. Por el Teorema 9 (o su corolario), 


R = E, --- EJEA 
donde E,, ..., E, son matrices elementales. Cada E, es inversible, y así 


A =Ej! --- ER. 
Como el producto de matrices inversibles es inversible, se ve que A es inversi- 
ble si, y solo si, R es inversible. Como R es una matriz (cuadrada) escalón re- 
ducida por filas, R es inversible si, y solo si, toda fila de R contiene un elemento 
no nulo, esto es, si, y solo si, R = I. Hemos visto que A es inversible si, y solo si, 
R = l, y si R = I entonces A = E, *,..., E '. Se ve ahora que (i), (ii) y (iii) 
son afirmaciones equivalentes respecto de A. |] 


Corolario. Si A es una matriz inversible n x n y si una sucesión de opera- 
ciones elementales de fila reduce A a la identidad, entonces la misma sucesión 
de operaciones, cuando se aplica a 1, da A~ +. 


Corolario. Sean A y B dos matrices m x n. Entonces B es equivalente por 
filas a A si, y solo si, B = PA. donde P es una matriz m x m inversible. 


Teorema 13. Para una matriz n x n, las siguientes afirmaciones son equi- 
valentes. 


(i) A es inversible. 

(11) El sistema homogéneo AX = 0 tiene solo la solución trivial X = 0. 

(ii) El sistema de ecuaciones AX = Y tiene una solución X para cada matriz 
Boe h E 


Demostración. De acuerdo con el Teorema 7, la condición (ii) es equiva- 
lente al hecho de que A es equivalente por filas a la matriz identidad. Por el 
Teorema 12, (i) y (ii) son, por tanto, equivalentes. Si A es inversible, la solu- 
ción de AX = Y es X= 4 'Y. Recíprocamente, supóngase que AX = Y 
tiene una solución para cada Y dada. Sea R una matriz reducida por filas que sea 
equivalente por filas a A. Se debe demostrar que R = 1. Esto equivale a demos- 
trar que la última fila de R no es 0 (idénticamente). Sea 


0 
0 
0 
1 
Si el sistema RX = E puede resolverse para X, la última fila de R no puede 


ser 0. Se sabe que R = PA, donde P es inversible. Luego RX = E si, y solo si, 
4X = P”*E. De acuerdo con (iii), el último sistema tiene una solución. 4 


Corolario. Una matriz cuadrada que tiene una inversa a la izquierda o a 
la derecha es inversible. 


"ARK 
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Demostración. Sea A una matriz m x n. Supóngase que A tiene una in- 
versa a la izquierda, es decir, una matriz B tal que BA = I. Entonces AX=0 
tiene solo la solución trivial, porque X = IX = B(AX). Luego A es inversible. 
Por otro lado, supóngase que 4 tiene una inversa a la derecha, es decir. una 
matriz C tal que AC = I. Entonces C tiene una inversa a la izquierda y es, por 
tanto, inversible. Se sigue entonces que A = C 71 y así A es inversible con in- 
versa C. | 


Corolario. Sea A = A,4,*** Ay donde Ay, ..., Ay son matrices (cua- 
dradas) n x n. Entonces A es inversible si, y solo si, cada Aj es inversible. 


Demostración. Se ha visto que el producto de dos matrices inversibles 
es inversible. De lo cual es fácil deducir que si cada A, es inversible entonces 
A es inversible. 

Supóngase ahora que A es inversible. Se demostrará primero que A, €s 
inversible. Supóngase que X es una matriz n x 1 y que A,X = 0. Entonces 
AX = (41, . - -, Az-1J41X = 0. Como A es inversible se debe tener que X = 0. 
El sistema de ecuaciones A,X = 0 no tiene, pues, solución no trivial, y así Aj €s 
inversible. Pero ahora A, `> * 441 = AA; €s inversible. Por lo dicho antes, 
Ay- 1 es inversible. Continuando en esta forma se concluye que todo A; es in- 
versible. Pp 


Quisiéramos hacer ahora un comentario final respecto a la solución de ecua- 
ciones lineales. Supóngase que A es una matriz m x n y que deseamos resolver 
el sistema de ecuaciones AX = Y. Si R es una matriz escalón reducida por filas, 
equivalente por filas a A, entonces R = PA, donde P es una matriz m x m 
inversible. Las soluciones del sistema AX = Y son exactamente las mismas 
que las soluciones del sistema RX = PY(=Z). En la práctica. no es mucho 
más difícil hallar la matriz P que reducir por filas Æ a R. En efecto, supóngase 
que se forma la matriz aumentada A’ del sistema AX = Y, con escalares arbi- 
trarios Y1, ..., Ym en su última columna. Si entonces se efectúa sobre Æ’ una 
sucesión de operaciones elementales de fila que lleve de Æ a R, se habrá acla- 
rado qué es la matriz P. (El lector deberá remitirse al Ejemplo 9, donde se llevó 
adelante esencialmente este proceso.) En particular si A es una matriz cuadrada 
este proceso deja en claro cuándo A es o no inversible, y si A es inversible cuál 
es la inversa P. Como ya se ha dado la parte principal de un ejemplo de tal cálcu- 
lo, solo se dará ahora un ejemplo de 2 x 2. 


Ejemplo 15. Supóngase que F es el cuerpo de los números racionales y 


A= k pil 
Así 


dd ile a E E 
1 3 Y 2 —1 y 0 -—7 Y-— 2Yo 


p 3 Ya 12 F 0 pa 


Ez, 


0 1 u-n) 0 1 Kun) 


de lo que resulta claro que A es inversible y 


icii 


Puede parecer engorroso seguir escribiendo los escalares arbitrarios y,, 
Ya. . .. en el cálculo de las inversas. Algunos encuentran más fácil proceder 
von dos sucesiones de matrices, una que describa la reducción de A a la identi- 
dad, y otra que registre el efecto de la misma sucesión de operaciones partiendo 
de la identidad. El lector juzgará por sí mismo cuál es la forma que le resulta 
más cómoda para contabilizar los cálculos. 


Ejemplo 16. Hallar la inversa de 


co a cop 
ID] 


Ba copt ai 


coja onpa jo col 


A a cole ao 


-i 
omy m O Om 


pus > 


-, 
a 

= =D ORO O-=0O0 
=00 
AS 


o 


ra a AR A, 
ala? 


0 
12 0 
—180 180, 


60  —60 
=36 192 —180 
30 —180 180, 
0 9 —36 30 
0} —36 192 —180 |; 
1 


30 —180 180 


He 


oo= 00- OOm OOm ukyh m 
"a 
D mse O ni 
-= 
Om 
A 9 oe 
LL 
y g ss Y rn le, E e 
I 
Om am in m 
l 


oon- 
O-=O O mne 


El lector se habrá percatado que se ha hecho un largo estudio sobre las filas 
de una matriz y no se ha dicho casi nada de las columnas. Se ha concentrado 
la atención en las filas por parecer ello más natural desde el punto de vista de 
las ecuaciones lineales. Dado que, obviamente, no hay ningún privilegio con 
respecto a las filas, lo tratado en la última sección pudo haberse hecho usando 
columnas en vez de filas. Si se define una operación elemental de columna y 
equivalencia por columna, es claro que toda matriz m x n será equivalente 


bia o a A A, ba ——— 
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por columnas a una matriz «escalón reducida por columnas». Así cada opera- 
ción elemental de columna será de la forma A — AE, donde E es una matriz 
elemental n x n, y así sucesivamente. 


Ejercicios 


1. Sea 


Bet 0 
0 3 5f 
=2 1 1 


Hallar una matriz escalón reducida por filas R que sea equivalente a A, y una matriz in- 
versible 3 x 3, P, tal que R = PA. 


2. Repetir el Ejercicio 1, pero con 
AE E 
A=|1 -3 —i]l 
i 1 1 
3. Para cada una de las dos matrices 
2 5-1 1 -1 2 
4 =i 2| 3 ¡2 4 
6 4 1 0 14 


emplear operaciones elementales de fila para determinar cuándo es inversible y encon- 
trar la inversa en caso que lo sea. 


4. Sea 
500 
A=|1 5 0f 
0.1 5 


¿Para qué X existe un escalar c tal que AX = cX? 


5. Determinar si l 


ooo 
conv 
om 
AS 


es inversible y hallar 47* si existe. 


6. Supóngase que A es una matriz 2 x 1 y que B es una matriz 1 x 2. Demostrar que 
C = AB no es inversible. 


7. Sea A una matriz (cuadrada) n x n. Demostrar las siguientes dos afirmaciones: 
(a) Si A es inversible y 4B = 0 para alguna matriz n x n, B, entonces B = 0. 
(b) Si A no es inversible, entonces existe una matriz n x n, B, tal que 4B=0, 

pero B + 0. 


SAA 


Ecuaciones lineales kam dh G 


8. Sea 


a b 
A c df 
Demostrar, usando operaciones elementales de fila, que A es inversible si, y solo si, 
lad — bc) + 0. 


9. Una matriz n x n, A, se llama triangular superior si A;; = 0 para i >j; esto es, si 
todo elemento por debajo de la diagonal principal es O. Demostrar que una matriz (cua- 
drada) triangular superior es inversible si, y solo si, cada elemento de su diagonal principal 
es diferente de 0. 


10. Demostrar la siguiente generalización del Ejercicio 6. Si A es una matriz m x n, B 
es una matriz n x m y n < m, entonces AR no es inversible. 


Il. Sea 4 una matriz m x n. Hacer ver que por medio de un número finito de operacio- 
nes elementales de fila y/o de columna se puede pasar de A a la matriz R que es simultá- 
neamente «escalón reducida por filas» y «escalón reducida por columnas»; es decir, R¡¿=0 
sii j Ri=11<i<r, Ri =0 si ¿> r. Demostrar que R = PAQ, donde P es una 
matriz inversible m x m y Q es una matriz inversible n x n. 


12. El resultado del Ejemplo 16 sugiere que tal vez la matriz 


1 1 

q de Fallo 

1-1 ? 1 
4=12 3 nti 
EI laa 
n n+l 2Zn— 1 


es inversible y 47? tiene elementos enteros. ¿Se puede demostrar esto? 


de cd, NAAA o o PP 


Po”. 4 -- 
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2. Espacios vectoriales 


2.1. Espacios vectoriales 


En varias partes de la matemática se presentan conjuntos donde tiene sentido 
y resulta interesante considerar las «combinaciones lineales» de los elementos 
de dichos conjuntos. Por ejemplo, en los sistemas de ecuaciones lineales, se 
encontró natural el considerar combinaciones lineales de las filas de una matriz 
Es probable que el lector ya haya estudiado cálculo y haya tenido que ver con 
combinaciones lineales de funciones; sobre todo si ha estudiado ecuaciones 
diferenciales. Tal vez el lector haya tenido experiencia con vectores en el es- 
pacio euclidiano tridimensional, y en particular con combinaciones lineales 
de tales vectores. 

Hablando en forma simple, el álgebra lineal es aquella rama de la matemáti- 
ca que trata de las propiedades comunes de los sistemas algebraicos, que constan 
de un conjunto más una noción razonable de «combinación lineal» de los ele- 
mentos del conjunto. En esta sección se definirán los objetos matemáticos que 
la experiencia ha mostrado ser las más útiles abstracciones de este tipo de sis- 
temas-algebraicos. 


Definición. Un espacio vectorial (o espacio lineal) consta de lo siguiente: 


1. un cuerpo F de escalares; 
2. un conjunto V de objetos llamados vectores; 
3. una regla (u operación) llamada adición, que asocia a cada par de vecto- 
res a, P de V un vector œ + ß de V, que se llama suma de u y fi, de tal modo que: 
(a) la adición es conmutativa, a + $ = B + a; 
(b) la adición es asociativa, a + (B + y) = (a + P) + y; 
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(c) existe un único vector O de V, llamado vector nulo, tal que a + 0 = 0, 
para todo a de V; 
(d) para cada vector a de V, existe un único vector —a de V, tal que 
1 + (—a)=0; 
4. una regla (u operación), llamada multiplicación escalar, que asocia a cada 
escalar c de F y cada vector œ de V a un vector ca en V, llamado producto de c y 


z. de tal modo que: 


(a) la = a para todo a de V; 
(b) (c,czJa = ci (c,a); 

(c) cla + p) = ca + cf; 

(d) (c, + czJa = c,0 + c20. 


Es importante observar, como la definición establece, que un espacio vec- 
torial es un objeto compuesto que consta de un cuerpo, de un conjunto de «vecto- 
res» y de dos operaciones con ciertas propiedades especiales. El mismo con- 
junto de vectores puede ser parte de distintos espacios vectoriales (véase Ejem- 
plo 5, más adelante). Cuando no hay posibilidad de confusión, se hará refe- 
rencia simplemente al espacio vectorial V, y cuando se desee especificar el cuerpo, 
se dirá que V es un espacio vectorial sobre el cuerpo F. El nombre «vector» se 
da a los elementos del conjunto V más bien por conveniencia. El origen del 
nombre se encontrará en el Ejemplo 1, pero no se debe dar mucha importancia 
al nombre mismo, ya que la variedad de objetos que pueden ser vectores en K 
puede no parecerse gran cosa a algún concepto de vector que el lector ya tenga. 
Se tratará de ilustrar esta variedad en una serie de ejercicios que será ampliada 
considerablemente cuando se comience el estudio sistemático de los espacios 
vectoriales. 


Ejemplo 1. El espacio de »-tuples, F”. Sea F cualquier cuerpo y sea V el 
conjunto de todos los n-tuples æ = (x1, X2, ---> Xy) de escalares x; de F. Si 
B= (Yis Ya» - - -» Jn) con y, de F, la suma de a y f se define por 


(2-1) a+ B = (a + Yi T2 + Yo > - - > Tn + Yn)- 
El producto de un escalar c y el vector a se define por 
(2-2) Ca = (021, La, -~ - y CEn)- 
Que esta adición vectorial y multiplicación escalar cumplen las condiciones 
(3) y (4) es fácil de verificar, usando las propiedades semejantes de la adición 
y multiplicación de los elementos de F. 

Ejemplo 2. El espacio de matrices m x n, pr Sea F cualquier cuerpo 
y sean m y n enteros positivos. Sea Fr*" el conjunto de todas las matrices 


m x n sobre el cuerpo F. La suma de dos vectores A y B en F"*" se define por 


(2-3) (4 + B)y = Ag + Bi. 


ió. A AA 
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El producto de un escalar c y de la matriz A se define por 


(2-4) (cA); = cAi 
Obsérvese que F!*" = F". 


Ejemplo 3. El espacio de funciones de un conjunto en un cuerpo. Sea F cual- 
quier cuerpo y sea S cualquier conjunto no vacío. Sea V el conjunto de todas 
las funciones de S en F. La suma de dos vectores f y g de V es el vector f+g; 
es decir, la función de S en F definida por 


(2-5) G + g9)(8) = f(s) + gls). 
El producto del escalar c y la función f es la función cf definida por 
(2-6) (cf)(s) = ef(s). 


Los ejemplos anteriores son un caso particular de este último. En efecto, un 
n-tuple de elementos de F puede considerarse como una función del conjunto 
S de los enteros 1, ..., n de F. En forma análoga, una matriz m x n sobre el 
cuerpo F es una función del conjunto S de los pares de enteros (i, j), 1 < i < m, 
1 <j <n, en el cuerpo F. Para este tercer ejemplo se indica cómo se puede 
verificar que las operaciones definidas satisfacen las condiciones (3) y (4). Para 
la adición vectorial: 


(a) Como la adición en F es conmutativa, 
F(s) + g(s) = g(s) + f(s) 


para todo s de S, luego las funciones f + g y g + f son idénticas. 
(b) Como la adición en F es asociativa, 


Fs) + [gls) + hCs)] = [£K(5) + g(s)] + h(s) 


para todo s, luego f + (g + h) es la misma función que (f + g) + h. 
(c) El único vector nulo es la función cero, que asigna a cada elemento 
de S el escalar 0 de F. 


(d) Para todo f de V, (—f) es la función dada por 
(=f)(8) = —F(). 


El lector encontrará fácil verificar que la multiplicación escalar satisface 
las condiciones de (4), razonando como se hizo para la adición vectorial. 


Ejémplo 4. El espacio de las funciones polinomios sobre el cuerpo F. Sea 
F un cuerpo y sea V el conjunto de todas las funciones f de F en F definidas 
en la forma 


(2-7) f) = o+ art --- + cer” 


donde co, Cy, . . . , €, son escalares fijos de F (independiente de x). Una función 
de este tipo se Ilama función polinomio sobre F. Sean la adición y la multipli- 
cación escalar definidas como en el Ejemplo 3. Se debe observar que si f y g 


E A —_— 
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son funciones polinomios y ¢ está en F, entonces f + g y cf son también fun- 
ciones polinomios. 


Ejemplo 5. El cuerpo C de los números complejos puede considerarse 
como un espacio vectorial sobre el cuerpo R de los números reales. En forma 
más general, sea F el cuerpo de los números reales y sea V el conjunto de los 
n-tuples a = (Xy, .. ., Xa), donde xy, . - ., Xa son números complejos. Se define 
la adición vectorial y la multiplicación escalar por (2-1) y (2-2), como en el 
Ejemplo 1. De este modo se obtiene un espacio vectorial sobre el cuerpo R que 
es muy diferente del espacio C” y del espacio R". 


Hay unos pocos hechos simples que se desprenden, casi inmediatamente, 
de la definición de espacio vectorial, y procederemos a derivarlos. Si c es un 
escalar y O es el vector nulo, entonces por 3(c) y 4(c) 


0 = c(0 +0) = 0 +00. 
Sumando — (c0) y por 3(d), se obtiene 


(2-8) 0 = 0. 
Análogamente, para el escalar O y cualquier vector a se tiene que 
(2-9) 0a =0. 


Si c es un escalar no nulo y a un vector tal que ca = 0, entonces por (2-8), 
e *Mca) = 0. Pero 

(ca) = (cja = la = a 
luego, a = 0. Así se ve que si c es un escalar y æ un vector tal que ca = 0, en- 


tonces c es el escalar cero o a es el vector nulo. 
Si æ es cualquier vector de V, entonces 


0 = 0a = (1 — 1)a = la + (—1)a = a + (—1)a 
de lo que se sigue que 
(2-10) 


Finalmente, las propiedades asociativa y conmutativa de la adición vectorial 
implican que la suma de varios vectores es independiente de cómo se combinen 
estos vectores y de cómo se asocien. Por ejemplo, Si %,, %z, %z, &4 SOn vectores 
de V, entonces 


{ar + 09) + (as + 04) = [02 + (04 + 03)] + 04 
y tal suma puede ser escrita, sin confusión, 


ai + œ + œ + 0 


Definición. Un vector ß de V se dice combinación lineal de los vectores 
A, -., Op en V, si existen escalares Cy, ..., C, de F tales que 


(—Da = —a. 


B = aa + -e + Caa = È Cidi. 


x_—ÉcÉ—— AA haa 
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Otras extensiones de la propiedad asociativa de la adición vectorial y las 
propiedades distributivas 4(c) y 4(d) de la multiplicación escalar se aplican 
a las combinaciones lineales: 


3 cia; + 3 dia; = 3 (c: + dJos 


c 3 Cia = 3 (cc;)a;. 
i=l i=l 

Ciertas partes del álgebra lineal están íntimamente relacionadas con la 
geometria. La misma palabra «espacio» sugiere algo geométrico, como lo hace 
el vocablo «vector» para muchos. Cuando se avance en el estudio de los es- 
pacios vectoriales, el lector observará que mucha de la terminología tiene una 
connotación geométrica. Para concluir esta sección introductoria sobre espacios 
vectoriales, se considerará la relación de los espacios vectoriales con la geo- 
metría, hasta un grado que indicará al menos el origen del nombre «espacio 
vectorial». Este será un breve análisis intuitivo. 

Considérese el espacio vectorial R?. En geometría analítica se identifican 
las ternas (X,, X2, X3) de números reales con los puntos del espacio euclidiano 
tridimensional. En tal contexto, un vector se suele definir como un segmento 
dirigido PQ, del punto P del espacio a otro punto Q. Ello equivale a una formu- 
lación cuidadosa de la idea de «flecha» de P a Q. Tal como son usados los vec- 
tores, se ha tenido en mente que queden definidos por su longitud y dirección. 
Así, se deben identificar dos segmentos dirigidos si tienen la misma longitud 
y la misma dirección. 

El segmento dirigido PQ, del punto P = (x,, X2, X3) al punto Q = (Yis 
Ya Y3), tiene la misma longitud y dirección que el segmento dirigido del origen 
0 = (0, 0, 0) al punto (y, — X1, Y2 — Xz» Y3 — X3). Además, este es el único 
segmento que partiendo del origen tiene la misma longitud y dirección que 
PQ. Con lo que, si se conviene en operar solo con vectores aplicados al origen, 
hay exactamente un vector asociado con cada longitud y dirección dadas. 

El vector OP, del origen a P = (x,, X2, X3) está completamente determi- 
nado por P, y es por ello posible identificar este vector con el punto P. En la 
definición del espacio vectorial R°, los vectores se definen simplemente como 
las ternas (x1, X2, X3). 

Dados los puntos P = (X1, Xz X3) y Q = (Yı; Yz Y3), la definición de suma 
de los vectores OP y OQ puede hacerse geométricamente. Si los vectores no 
son paralelos, entonces los segmentos OP y OQ determinan un plano y estos 
segmentos son dos de los lados de un paralelogramo en aquel plano (véase 
Figura 1). La diagonal de este paralelogramo, que va de 0 al punto S, define 
la suma de OP y OQ como el vector OS. Las coordenadas del punto § son 
(x1 + Y X2 + Yz X3.+ Y3), con lo que esta definición geométrica de la adi- 
ción vectorial es equivalente a la definición algebraica del Ejemplo 1. 

La multiplicación escalar tiene una interpretación geométrica simple. Si 
c es un número real, entonces el producto de c por el vector OP es el vector 
que parte del origen de longitud |c| veces la longitud de OP y dirección que coin- 


A a —_». — 
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S(x, + Y1, X2 + Y2 Xa + Y3) 


P(X1,X2, X3) 


QU. Y2: Ya) 


FIGURA 1 


cide con la de OP si e > 0, y que es opuesta a la dirección de OP si c < 0. Esta 
multiplicación escalar da justamente el vector OT donde T = (cx,, CX2, CX3), 
y es, por tanto, compatible con la definición algebraica dada en R?. 

De vez en cuando el lector encontrará probablemente provechoso «pensar 
gcométricamente» en espacios vectoriales, eso es, trazar gráficos que lo ayuden 
a ilustrar y motivar alguna de las ideas. Ciertamente, deberá hacerlo. Sin em- 
bargo, al hacer tales ilustraciones, debe tenerse presente que, por tratar los 
espacios vectoriales como sistemas algebraicos, todas las demostraciones que 
se hagan deben ser de naturaleza algebraica. 


Ejercicios 
1. Si Fes un cuerpo, verificar que F" (como se definió en el Ejemplo 1) es un espacio vec- 
torial sobre el cuerpo F. 


2. Si V es un espacio vectorial sobre el cuerpo F, verificar que 
(4 + a) + (as + a) = [02 + (as + 019] + 04 


para todos los vectores %1, %z, 0% Y %4 de V. 


3. Si C es el cuerpo de los complejos, ¿qué vectores de C3 son combinaciones lincales de 
(1, 0, —1), (0, 1, 1) y (LL, 1)? 
4. Sea V el conjunto de los pares (x, y) de números reales, y sea F el cuerpo de los nú- 
meros reales. Se define 
(2,1) + (119) = (7 F 3u Y +9) 
e(z, y) = (cz, y). 


¿Es V, con estas operaciones, un espacio vectorial sobre el cuerpo de los números reales? 


pq $T BEBE Eo A A S S 
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5. En R” se definen dos operaciones 


abB=a—B 


c-Q&= —Ca. 


Las operaciones del segundo miembro son las usuales. ¿Qué axiomas de espacio vectorial 
se cumplen para (R”, O, -)? 


6. Sea V el conjunto de todas las funciones que tienen valor complejo sobre el eje real, 
tales que (para todo ¢ de R) 


K—) =F0. 
La barra indica conjugación compleja. Demostrar que V, con las operaciones 


U+DO = K +90) 
HO = fÀ 


es un espacio vectorial sobre el cuerpo de los números reales. Dar un ejemplo de una fun- 
ción en V que no toma valores reales. 


7. Sea V el conjunto de pares (x, y) de números reales y sea F el cuerpo de los números 
reales. Se define 
(2, y) + (2n 11) = (2 + 21, 0) 
e(z, y) = (cz, 0). 


¿Es V, con estas operaciones, un espacio vectorial? 


2.2. Subespacios 


En esta sección se introducirán algunos de los conceptos básicos en el es- 
tudio de los espacios vectoriales. 


Definición. Sea V un espacio vectorial sobre el cuerpo F. Un subespacio 
de V es un subconjunto W de V que, con las operaciones de adición vectorial y 
multiplicación escalar sobre V, es el mismo un espacio vectorial sobre F. 


Una comprobación directa de los axiomas para un espacio vectorial, de- 
muestra que el subconjunto W de V es un subespacio si, para todos los a y f 
de W, el vector a + $ está también en W; el vector O está en W; para todo a 
de W, el vector (— a) está en W; para todo a de W y todo escalar c, el vector ca 
está en W. La conmutatividad y asociatividad de la adición vectorial y las pro- 
piedades (4)(a), (b), (c) y (d) de la multiplicación escalar no necesitan ser com- 
probadas, ya que éstas son propiedades de las operaciones en V. Se pueden 
simplificar aún más las cosas. 


Teorema 1. Un subconjunto no vacio W de V es un subespacio de V si, y 
solo si, para todo par de vectores a, B de W y todo escalar c de F, el vector ca + $ 
está en W. 


Demostración. Supóngase que W sea un subconjunto no vacío de V tal 


e cx + f pertenezca a W para todos los vectores a, 8 de W y todos los esca- 
res e de F. Como W no es vacío, existe un vector p en W, y, por tanto, (—1)p + 
= U está en W. Ahora bien, si a es cualquier vector de W y c cualquier escalar, 


Wl vector ca = ca + 0 está en W. En particular, (—1)a = —a está en W. Final- 


mente, si a y f están en W, entonces a + B = la + $ está en W. Así, W es un 
iubespacio de V. 

Recíprocamente, si W es un subespacio de V, a y f están en W y c es un es- 
Galar, ciertamente ca + f está en W. f 


Algunos prefieren usar la propiedad ca + f del Teorema 1 como defini- 
vión de un subespacio, lo que es apenas diferente. Lo importante es que, si W es 
un subconjunto no vacío de Y tal que ca + f está en W para todos los a, f de 
W y todo c de F, entonces W (con las operaciones heredadas de V) sea un es- 
Pacio vectorial. Esto da lugar a muchos nuevos ejemplos de espacios vectoriales. 


Ejemplo 6. 

(a) Si V es cualquier espacio vectorial, V es un subespacio de V; el sub- 
vonjunto que consta solo del vector nulo es un subespacio vectorial de V, Ila- 
mado subespacio nulo de Y*. 

(b) En F, el conjunto de los n-tuples (x,, ..., x,) con x, = 0 es un sub- 
espacio, pero el conjunto de los n-tvples con x, = 1 + x, no es un subespa- 
vio (n > 2). 5 

(c) El espacio de las funciones polinomios sobre el cuerpo F es un subes- 
pacio del espacio de todas las funciones de F en F. 

id) Una matriz (cuadrada) n x n, sobre el cuerpo F es simétrica si 4, = Aj 
para todo į y j. Las matrices simétricas forman un subespacio del espacio de 
las matrices n x n sobre F. 

(e) Una matriz (cuadrada) n x n, A, sobre el cuerpo C de los números 


complejos es hermítica (o autoadjunta) si 


An = Ay 


para todo j, k, donde la barra indica conjugación compleja. Una matriz 2 x 2 
es hermítica si, y solo si, tiene la forma 


[ z EM 
z— iy, w 


donde x, y, z y w son números reales. El conjunto de todas las matrices hermi- 
ticas no es un subespacio del espacio de todas las matrices n x n sobre C. En 
efecto, si A es hermítica, sus elementos en la diagonal 411, A22, ..., SON nú- 
meros reales, pero los elementos diagonales de i4, en general, no son reales. 
Por otro lado, es fácil ver que el conjunto de las matrices hermíticas n x n es 
un espacio vectorial sobre el cuerpo de los números reales (con. las operaciones 
usuales). 


* Nota del traductor: Estos subespacios se llaman comúnmente los subespacios triviales de V. 


e haii AA AAA 
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Ejemplo 7. El espacio solución de un sistema homogéneo de ecuaciones 
lineales. Sea Æ una matriz m X n sobre F. Entonces el conjunto de todas las 
matrices (columna) n x 1, X, sobre F tal que AX = 0 es un subespacio del 
espacio de todas las matrices n x 1 sobre F. Para demostrar esto se necesita 
probar que A(cX + Y) = 0 si AX = 0, AY =0ycun escalar arbitrario de F. 
Esto se desprende inmediatamente del siguiente hecho general. 


Lema. Si A es una matriz m x n sobre F, y B, C son matrices n x p so- 
bre F, entonces 


(2-11) A(dB + C) = d(AB) + AC 
para todo escalar d de F. 


Demostración. [A(dB + C)lis = 3 Au(dB + C)ri 


z 

k 
= z (dA «Bi; + AuCuj) 
= dz AxB; + x AxCki 


= d(AB);; + (AC); 
= [d(AB) + ACI: M 


En forma semejante se puede ver que (dB + C)A = d(BA) + CA, si la suma 
y el producto de las matrices están definidos. 


Teorema 2. Sea V un espacio vectorial sobre cl cuerpo F. La intersección 
de cualquier colección de subespacios de V es un subespacio de V. 


Demostración. Sea {W,} una colección de subespacios de V, y sea W = 
M Wa su intersección. Recuérdese que W está definido como el conjunto de 
todos los elementos pertenecientes a cada W, (véase Apéndice). Dado que 
todo W, es un subespacio, cada uno contiene el vector nulo. Así que el vector 
nulo está en la intersección W, y W no es vacio. Sean a y f vectores de W y sea 
c un escalar. Por definición de W ambos, a y f3, pertenecen a cada W,, y por ser 
cada W, un subespacio el vector (cx + $) está en cada W,. Así (ca + f) está 
también en W. Por el Teorema 1, W es un subespacio de V. | 


Del Teorema 2 se deduce que si S es cualquier colección de vectores de Y, 
entonces existe un subespacio mínimo de V que contiene a S; esto es, un sub- 
espacio que contiene a S y que está contenido en cada uno de los otros subespa- 
cios que contienen a $. 


Definición. Sea S un conjunto de vectores de un espacio vectorial V. El sub- 
espacio generado por S se define como intersección W de todos los subespacios 
de V que contienen a S. Cuando S es un conjunto finito de vectores, S = (0, 
Qz, - - -> On} se dice simplemente que W es el subespacio generado por los vectores 
a a 


DA 
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Teorema 3. El subespacio generado por un subconjunto S no vacio de un 


espacio vectorial V es el conjunto de todas las combinaciones lineales de los vec- 
tores de S. 


Demostración. Sea W el subespacio generado por S. Entonces toda com- 
bimación lineal 


a = 210 + 2209 + --* + Emam 


de vectores %,, Az, . . ., Xm de S pertenece evidentemente a W. Así que W con- 
tine el conjunto L de todas las combinaciones lineales de vectores de S. El 
conjunto L, por otra parte, contiene a S y no es, pues, vacío. Si a, $ pertene- 
ten a L, entonces a es una combinación lineal, 

a = 210 + 2:02 + <ie + LmQm 


de vectores a, de S, y f es una combinación lineal, 


B = ybi + Yb + >>> + YnBn 
de vectores f; en S. Para cada escalar c, 


ca +B = 2 (crias + 3 Vbi 
i= is 


Luego ca + ff pertenece a L. Con lo que L es un subespacio de V. 

Se ha demostrado que L es un subespacio de V que contiene a S, y también 
que todo subespacio que contiene a S contiene a L. Se sigue que L es la inter- 
sección de todos los subespacios qué contienen a S; es decir, que £ es el sub- 
espacio generado por el conjunto S. F 


Definición. Si S,, S2, ..., S, son subconjuntos de un espacio vectorial V, 
el conjunto de todas las sumas 
CAE TPE 7 


de vectores a, de S; se llama suma de los subconjuntos S,, S2, - 
senta por 


- -> Sp y se repre- 
Si FSFE F S 
o por 


Si W,, W,, ..., Wp son subespacios de V, entonces la suma 


W=W,+W,+ -eS +W: 
como es fácil ver, es un subespacio de V que contiene cada uno de los subes- 


pacios W;. De esto se sigue, como en la demostración del Teorema 3, que W 
es el subespacio generado por la unión de W,, Wa, .... Wi. 
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Ejemplo 8. Sea F un subcuerpo del cuerpo C de los números complejos. 
Supóngase que 
œ = (1,2, 0, 3, 0) 
ez = (0,0, 1, 4, 0) 
os = (0,0, 0, O, 1). 


Por el Teorema 3, un vector «a está en el subespacio W de F° generado por 01, 
%, Uz si, y solo si, existen escalares C1, Cz, C3 en F, tales que 


a = c10 -+ Cza + Cas. 
Así, W consta de todos los vectores de la forma 


æ = (61, 261, C2, 3c1 + 42, C3) 


donde c,, cz, cz son escalares arbitrarios de F. En forma alternativa, W puede 
ser escrito como el conjunto de todos los 5-tuples 


a = (21, La, La, Lay 25) 
con x; en F, tal que 


Ta = 221 
Ta = 321 + 4a. 


Así (-3, —6, 1, —5, 2) está en W, mientras que (2, 4, 6, 7, 8) no. 
Ejemplo 9. Sea F un subcuerpo del cuerpo de los números complejos, 


y sea V el espacio vectorial de todas las matrices 2 x 2 sobre F. Sea W, el sub- 
conjunto de V que consta de todas las matrices de la forma 


Es 
z 0 
donde x, y, z son escalares arbitrarios de F. Por último, sea W, el subconjunto 
de Y que consta de todas las matrices de la forma 


. [e 4) 


donde x e y son escalares arbitrarios de F. Entonces W, y W, son subespacios 
de V. También 


V = W,+ Wa 


a b a b 0 0 
E 3 -L:0]+ [o af 
El subespacio W, N Wz consta de todas las matrices de la forma 


[o 0) 
0 0 


porque 


Ejemplo 10. Sea 4 una matriz m x n sobre el cuerpo F. Los vectores fila 
A son los vectores de F" dados por a; = (Airs -- -> Ain) E= 1, ..., m. El 
bespacio de F” generado por los vectores fila se llama el espacio de filas de A. 
l subespacio considerado en el Ejemplo 8 es el espacio de filas de la matriz 


12030 
A=|0 0 1 4 Ol 
000.0 1 


Vx también el espacio de filas de la matriz 


1.20 30 
| o 01 40 
B=l o 00 01 

-4 -8 1-80 


Ejemplo 11. Sea V el espacio de todas las funciones polinomios sobre F. 
Sea S el subconjunto de V que consta de las funciones polinomios fo, fi» f2» --- 
definido por 


fala) =x”, .n=0,1,2.... 
Entonces V es el subespacio generado por el conjunto S. 


Ejercicios 


i, ¿Cuáles de los siguientes conjuntos de vectores a = (a,, 


de Re e -> An) de R” son subespa- 
Mos de R” (n > 3)? 


(a) todos los a tal que a, > 0; 

{b) todos los a tal que a, + 3a, = az; 
tc} todos los a tal que a, = ay; 

(d) todos los a tal que a,a, = 0; 

fe) todos lps æ tal que a, es racional. 


1. Sca V el espacio vectorial (real) de todas las funciones f de R en R. ¿Cuál de los si- 
guientes conjuntos de funciones son subespacios de V? 

(a) todas las f tales que f(x?) = f(x}; 

(b) todas las f tales que f(0) = (1); 

(c) todas las f tales que f(3) = 1 + A-5); 

(d) todas las f tales que f(—1) = 0; 

(e) todas las f que son continuas. 


A, ¿Pertenece el vector (3, —1, 0, — 1) al subespacio de R* generado por 10s vectores 
E. —1, 3, 2), (-1, 1, 1, —3) y (1, 1,9, —5)? 


A. Sea W el conjunto de todos los (x,, X2, X3, Xy, X5) de R* que satisfacen 


2m — nto- Za =0 
Y + Lu 
9x1 — 322 + 624 — 3x4 — 325 = 0. 


—- 2-0 


Encontrar un conjunto finito de vectores que genera W. 
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5. Sean F un cuerpo y n un entero positivo (n > 2). Sea V el espacio vectorial de todas 
las matrices n x n sobre F. ¡Cuáles de los siguientes conjuntos de matrices A de V son 
subespacios de V? 


(a) todas las A inversibles; 

(b) todas las A no inversibles; 

(c) todas las A para las que AB = BA, donde B es cierta matriz dada de V; 

(d) todas las A para las que 4? = A. 

6. (a) Demostrar que los únicos subespacios de R* son R' y el subespacio nulo. 

(b) Demostrar que un subespacio de R? es R? o el subespacio nulo o consta de todos 
los múltiplos escalares de algún vector fijo de R?. (El último tipo de subespacio es, intuiti- 
vamente, una recta por el origen.) 

(c) ¿Puede usted describir los subespacios de R°? 


7. Sean W, y W, subespacios de un espacio vectorial V tal que la unión conjuntista de 
W, y W, sea también un subespacio. Demostrar que uno de los espacios W, está contenido 
en el otro. 


8. Sea V el espacio vectorial de todas las funciones de R en R; sea V, el subconjunto de 
las funciones pares, fl—x)= f(x); sea V; el subconjunto de las funciones impares, 
Soy = $). 

(a) Demostrar que V, y V; son subespacios de V. 

(b) Demostrar que V, + V; = V. 

(c) Demostrar que V, N V; = (0). 


9. Sea W, y W, subespacios de un espacio vectorial V tales que W, + W, = V y 
W, Mw, = {0}. Demostrar que para todo vector æ de V existen únicos vectores o, en 
W, y a, en W, tales que « = 0, + Az. 


2.3. Bases y dimensión 


Pasamos, ahora, a la tarea de dotar de dimensión a ciertos espacios vec- 
toriales. Aunque usualmente asociamos «dimensión» con algo geométrico, 
debemos encontrar una definición algebraica apropiada para la dimensión de 
un espacio vectorial. Esto se hará mediante el concepto de base de un espacio 
vectorial. ! 

Definición. Sea V un espacio vectorial sobre F. Un subconjunto S de V se 
dice linealmente dependiente (o simplemente, dependiente) si existen vectores distin- 
1OS 0, Qz, - .., % de S y escalares Cy, Cz, . - - , Ca de F, no todos nulos, tales que 


Citi + 07%) Hie + Cp, = 0. 


Un conjunto que no es linealmente dependiente se dice linealmente independiente. 
Si el conjunto S tiene solo un número finito de vectores 0%, 02, .. -, 0, se dice, 
a veces, que los 4, %2, . . - , 0, Son dependientes (o independientes), en vez de decir 
que S es dependiente (o independiente). 


, 
Las siguientes son fáciles consecuencias de la definición. 


I. Todo conjunto que contiene un conjunto linealmente dependiente es 
mente dependiente. 

2. Todo subconjunto de un conjunto linealmente independiente es lineal- 

mente independiente. 

3. Todo conjunto que contiene el vector O es linealmente dependiente; 
vn electo, 1-0 = 0. 

4. Un conjunto S de vectores es linealmente independiente si, y solo si, 
todo subconjunto finito de S es linealmente independiente; es decir, si, y solo 
Ai, para vectores diferentes %,, .. ., a, de S, arbitrariamente elegidos c,0%, ++: -** 
E c,2, = 0 implica que todo c; = 0. 


Definición. Sea V un espacio vectorial. Una base de V es un conjunto de 
vectores linealmente independiente de V que genera el espacio V. El espacio V es 
de dimensión finita si tiene una base finita. 


Ejemplo 12. Sea F un subcuerpo de los números complejos. En F? los 
vectores 


a=( 3,0, —3) 
a =(-1,1, 2) 
a =( 4,2, —2) 
a=( 21, 1) 


son linealmente dependientes, pues 
201 + 202 — as +0: œ = 0. 


Los vectores 


a = (1, 0, 0) 
e = (0, 1, 0) 
€ = (0, 0, 1) 


son linealmente independientes. 


Ejemplo 13. Sea F un cuerpo, y en F' sea S el subconjunto que consta 
de los vectores €,, €z, ..., €, definidos por 
a= (1,0,0;...,0) 
e =(0,1,0,...,0) 


€ = (0,0,0,..., 1). 


Sean xi, X2, ---, X, escalares de F, y hágase 4 = Xx,0, + X20 + *** + Xrm. 
Entonces 
(2-12) a = (tı, La)... , En). 


Esto muestra que €,, . . - , €, generan F". Como a=0 si, y solo si, x; =X3=...= 
Y, = 0, los vectores €, ..., €, son linealmente independientes. El conjunto 


42 http://libreria-universitaria.blo 


S = [€,, - . - , €} es, por tanto, una base de F". Esta base particular se llamará 
base canónica de F”. 


Ejemplo 14. Sea P una matriz n x n inversible con elementos en el cuer- 


po F. Entonces Py, ..., P,, las columnas de P, forman una base del espacio 


de las matrices columnas F"*!. Eso se verá como sigue. Si X es una matriz co- 
lumna, entonces 


PX = aP + -0 +2%.,Pn. 


Como PX = 0 tiene solo la solución trivial X = 0, se sigue que Prez P,} 
es un conjunto linealmente independiente. ¿Por qué generan F"**? Sea Y cual- 
quier matriz columna. Si X = P”*Y, entonces Y = PX, esto es 


Y = aP + + F LaPa 
Así, [P,, ..., P,} es una base de F"*!. 


Ejemplo 15. Sea A una matriz m x n y sea S el espacio solución del sis- 
tema homogéneo AX = 0 (Ejemplo 7). Sea R una matriz escalón reducida 
por filas que es equivalente por filas a A. Entonces S es también el espacio so- 
lución del sistema RX = 0. Si R tiene r filas no nulas, entonces el sistema de 
ecuaciones RX = 0 simplemente expresa r de las incógnitas Xy, ..., X, En tér- 
minos de las (n — r) incógnitas x, restantes. Supóngase que los elementos prin- 
cipales, no nulos, de las filas no nulas están en las columnas k,, . . ., k,. Sea J el 
conjunto constituido por los n — r índices diferentes de kı, ..., kp: 


J=4(1,...,n) — (Ka, ..., k}. 
El sistema RX = 0 tiene la forma 
Th + Z at; = 0 


ao 


donde los c;j son ciertos escalares. Todas las soluciones se obtienen asignando 
(arbitrariamente) valores a aquellos x; con j en J y calculando los correspon- 
dientes valores de x1, . . - > Xx. Para cada j de J, sea E; la solución obtenida al 
hacer x; = 1 y x; = 0, para todos los otros i de J. Se afirma que los (n — r) 
vectores E;, con j en J, forman una base para el espacio solución. 

Como la matriz columna Æ; tiene un 1 en la fila j y ceros en las restantes 
filas, las razones dadas en el Ejemplo 13 permiten concluir que el conjunto 
de estos vectores es linealmente independiente. Por esta razón ese espacio ge- 
nera el espacio solución. Si la matriz columna 7, con elementos f,, ..., tn, per- 
tenece al espacio solución, la matriz 


N = EE; 
J 
pertenece también al espacio solución, y es una solución tal que x; = tj para 


cada j de J. La solución con esta propiedad es única; luego N = T y T perte- 
nece al espacio generado por los vectores Ej. 


Ejemplo 16. Daremos ahora un ejemplo de una base infinita. Sea F un 
hcuerpo de los números complejos y sea V el espacio de las funciones poli- 
mios sobre F. Se recuerda que estas funciones son las de F en F que tienen 
forma 


fo = o + art -+H es. 


Yen A(x) = %,k = 0, 1, 2, . . . El conjunto (infinito) {fo Jis fa» - - J es una base 
de V. Es claro que el conjunto genera V, pues la función f anterior €s 


PR E a E + ele 


{I lector verá que esto es virtualmente una repetición de la definición de la fun- 
vión polinomio, es decir, una función de F en F es una función polinomio si, 
y solo si, existe un entero n y escalares Co, - - -, Cp tales que f = Cofo +: *+ 
tn/n- ¿Por qué son estas funciones independientes? Demostrar que el conjunto 
Was fis fa» - - -} es independiente, es lo mismo que demostrar que todo sub- 
vonjunto finito suyo es independiente. Bastará entonces demostrar que, para 
todo n, el conjunto (fo, ---, Ja} es independiente. Supóngase que 


Cafo + -** + nfn = 0. 
Fsto dice que 
+ att +: H ena” =0 


pära todo x de F; en otras palabras, cada x de F es raíz del polinomio f(x) = 
ly + cx + => > + C,x". Se supone que el lector sabe que un polinomio de grado n 
“on coeficientes complejos puede tener a lo sumo n raices distintas. Se sigue 
que, Co = (1 =:::=C,=0. 

Se ha visto una base infinita de V. ¿Quiere decir esto que V no es de dimen- 
sión finita? En realidad, es así, pero ello no se deduce de la definición, porque 
de todo lo que se sabe V podría tener también una base finita. Esa posibilidad 
queda fácilmente descartada. (Se eliminará en general en el siguiente teorema.) 
Supóngase que tenemos un número finito de funciones polinomios 81, ..., 8r- 
Habrá una mayor potencia de x que aparece (con coeficiente no nulo) en g,(x), ..., 
g,{x). Si tal potencia es k, es claro que fi ,:(x) = x*** no pertenece al subes- 
pacio generado por los gy, ...> 8r- Así, pues, V no es de dimensión finita. 


Un comentario final respecto a este ejemplo. Una base infinita no tiene 
nada que ver con «combinaciones lineales infinitas». El lector que sienta el 
deseo irresistible de introducir series de potencias F 

o 

Y Or 

k=0 
en este ejemplo, debe estudiarlo cuidadosamente de nuevo. Si con ello no se 
le aclara todavía, debe limitar su atención, de ahora en adelante, a espacios 
de dimensión finita. 


Teorema 4. Sea V un espacio vectorial generado por un conjunto finito de 
vectores Bi, Ba ---, Bm- Entonces todo conjunto independiente de vectores de 
V es finito y no contiene más de m elementos. 


PO 0ÓQT03g3OÁÉÁÉÁ— AQ 


A A. MA a A AA PP 
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Demostración. Para demostrar este teorema es suficiente ver que todo 
subconjunto S de V que contiene más de m vectores es linealmente dependiente. 
Sea S un tal conjunto. En S hay vectores diferentes %,, %,, - . . , %n, donde n > m. 
Como $, ..., Pm generan V, existen escalares A; en F tales que 

m 
aj = Y Auf. 
i=l 
Para cualesquiera n escalares xi, X23, ..., Xp, se tiene 


mna t e Hatan = y Tja; 
j=l 


jal im 


3 2; 3 Aybi 


= Y È (Asa)Bi 


j=l i=l 


> È Asc) 


i=l - 


Como n > m, el Teorema 6 del Capítulo 1 implica que existen escalares x,, 
X2», -+ -, Xp» no todos 0, tales que 


Luego Xii + X202 + *** + xo, = 0. Ello demuestra que S es un conjunto 
linealmente dependiente. | 


Corolario 1. Si V es un espacio vectorial de dimensión finita, entonces dos 
bases cualesquiera de V tienen el mismo número (finito) de elementos. 


Demostración. Como V es de dimensión finita, tiene una base finita 
(Br, Ba - - => Bm)- 


Por el Teorema 4, toda base de V es finita y contiene no más de m elementos. 


Así, si (%,, %, . - - , a, y es una base, n < m. Por el mismo razonamiento, m < n. 
Luego m =n. ii 


Este corolario permite definir la dimensión de un espacio vectorial de di- 
mensión finita como el número de elementos de una base cualquiera de V. Se 
indicará ia dimensión de un espacio V de dimensión finita por dim Y. Ello nos 
permite volver a enunciar el Teorema 4 como sigue. 


Corolario 2. Sea V un espacio vectorial de dimensión finita y sea n = dim V. 
Entonces 


(a) cualquier subconjunto de V que contenga más de n vectores es linealmente 
dependiente; 


Espactos vectoriales 


— A UP o cr Se 


(b) ningún subconjunto de V que contenga menos de n vectores puede ge- 
nerar V. 


ijemplo 17. Si F es un cuerpo, la dimensión de F" es n, porque la base 
canónica de F" contiene n vectores. El espacio de las matrices F”*” tiene di- 
mensión mn. Ello es claro por analogía con el caso de F”, ya que las mn matri- 
ves que tienen un 1 en el lugar į, j, con ceros en los demás, forman una base de 
"=" Si A es una matriz m x n, entonces el espacio solución de A tiene dimen- 
sión n — r, donde r es el número de filas no nulas de una matriz escalón reducida 
por Flas, que es equivalente por filas a A. Véase el Ejemplo 15. 

Si V es cualquier espacio vectorial sobre F, el subespacio nulo de V es ge- 
nerado por el vector 0, pero {0} es un conjunto linealmente dependiente y no 
una base. Por esta razón se conviene que el subespacio nulo tenga dimensión 0. 
Se podría llegar también a la misma conclusión pensando que el conjunto vacío 
es una base del subespacio nulo. El conjunto vacio genera (0), pues la intersec- 
ción de todos los subespacios que contiene el conjunto vacío es {0}, y el conjunto 
vacio es linealmente independiente, porque no contiene vectores. 


Lema. Sea S un subconjunto linealmente independiente de un espacio vecto- 
rial V. Supóngase que ß es un vector de V que no pertenece al subespacio generado 
por S. Entonces el conjunto que se obtiene agregando ß a S, es linealmente inde- 
pendiente. 


Demostración. Supóngase que %,, . . . , Om SON vectores distintos de S y que 
aer + +++ + Cum + bg = 0. 


Entonces b = 0; de otra manera, 


y B está en el subespacio generado por S. Así, C,% + *** + Com = 0, y como 
S es un conjunto linealmente independiente, todo c; = 0. | 


Teorema 5. Si W es un subespacio de un espacio vectorial de dimensión 
finita V, todo subconjunto linealmente independiente de W es finito y es parte 
de una base (finita) de W. 


Demostración. Supóngase que Sy es un conjunto linealmente independiente 
de W. Si S es un subconjunto linealmente independiente de W que contiene 
a So, entonces S es también un subconjunto linealmente independiente de V; 
como V es de dimensión finita, S no tiene más de dim V elementos. 

Se extiende Sọ a una base de W, como sigue. Si Sy genera W, entonces Sy 
es una base de W y está demostrado. Si Sọ no genera W, por el lema anterior 
se halla un vector f, en W tal que el conjunto S, = So U {£1} es independiente. - 
Si S, genera W, está demostrado. Si no, se aplica el lema para obtener un vector Ba 


CO: a id 


> A aii 
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en W tal que S, = S, U {$2} es independiente. Si se continúa de este modo, 
entonces (y en no más de dim y de etapas) se llega a un conjunto 

= B U (Br, - - >, Bm) 
que es una base de W. J 


Corolario 1. Si W es un subespacio propio de un espacio vectorial de di- 
mensión finita V, entonces W es de dimensión finita y dim W < dim V. 


Demostración. Podemos suponer que W contiene un vector a + 0. Por 
el Teorema 5 y su demostración existe una base de W que, conteniendo a g, 
no contiene más que dim Y elementos. Luego W es de dimensión finita y 
dim W < dim V. Como es un subespacio propio existe un vector f en V que 
no está en W. Agregando $f a cualquier base de W se obtiene un subconjunto 
linealmente independiente de V. Así, dim W < dim V. J 


Corolario 2. En un espacio vectorial V de dimensión finita todo conjunto 
linealmente independiente de vectores es parte de una base. 


Corolario 3. Sea A una matriz n x n sobre el cuerpo F, y supóngase que 
los vectores fila de A forman un conjunto linealmente independiente de vectores 
de F". Entonces Á es inversible. 


Demostración. Sean a, 0%, . . ., 0, vectores fila de A, y supóngase que W es 
un subespacio de F" generado por %,, %, . . . , %,. Como los %,, %7, ..., %, SON 
linealmente independientes, la dimensión de W es n. Por el Corolario 1 se tiene 
que W = F". Luego existen escalares B; en F tales que 


n 
= 3 Bija, 1<:i<n 


j=i 


donde (€, €,, . . ., €} es la base canónica de F". Así, para la matriz B de ele- 
mentos B,, se tiene 


BA =1. | 
Teorema 6. Si W, y W, son subespacios de dimensión finita de un espacio 
vectorial, entonces W, + W, es de dimensión finita y 
dim W, + dim W, = dim (W, N W,) + dim (W + W,). 
Demostración. Por el Teorema 5 y sus corolarios, W, N W, tiene una 
base finita fa, ..., 0) que es parte de la base 
A Ba, ar para W, 
y parte de la base 
fei oTe Yi Y para W,. 
El subespacio W, + W, es generado por los vectores 


Qt) ++ - 30%) Br - - - s Bm, Yo --<, Yn 


y estos vectores forman un conjunto independiente. En efecto, supóngase que 


2 2,0; + 2 yB; + E zyr =0. 


Entonces 


— È zy = È tiai + 2 yb; 


que muestra que Y z,y, pertenece a W,. Como È z,y, también pertenece a W3, 
ne sigue que 
È zyr = E cia; 


para ciertos escalares c4, ..., Ck- Como el conjunto 


{a - - ¿1 Un Vis < ea Ya 
es independiente, cada uno de los escalares z, = 0. Así, 
È zia; + 2 yB; = 0 
y como 
E EE E: E 
es también un conjunto independiente, cada x; = 0 y cada y; = 0. Así, 
l%)..., 0%) Bis.» -Êm Yi» -o s Yaj 


es una base para W, + W,. Finalmente, 


dim W, + dim W: = (k + m) + (k + n) 
=k+(m+k+n) 
= dim (W, N W,) + dim (W, + W3). | 


Cerremos esta sección con una observación referente a la independencia 
y depéndencia lineal. Se han definido estos conceptos para conjuntos de vec- 
tores. Es útil haberlos definido para sucesiones finitas (n-tuples ordenados) 
de vectores: %, ..., 0%. Se dirá que los vectores %%;, ..., 4, Son linealmente 
dependientes si existen escalares fijos C,, ..., Ch, no todos nulos, tales que 
£1% + --- ++ CA, = 0. Todo esto es tan natural que el lector podría creer 
que se ha usado ya esta terminología. ¿Cuál és la diferencia entre una suce- 
sión finita a4, . . . , æ, y el conjunto (%;, - . . , %,)? Hay dos diferencias: identidad 
y orden. 

Si se examina el conjunto (%,, ..., Œa} es corriente suponer que no hay 
dos vectores %,, ..., Œ, que sean idénticos. En una sucesión 0%,, ..., X, todos 
los a, pueden ser el mismo vector. Si q, = œj, para algún i + j, entonces la su- 
cesión 0%, ..., 0, €s linealmente dependiente: 


as + (—1)a; = 0. 


Así, Si æ}, - - - , %, SON linealmente independientes, todos son distintos, y se pue- 
de hablar del conjunto {¢;, ..., a) sabiendo que tiene n vectores. Así, evi- 
dentemente, ninguna confusión surgirá en el estudio de bases y dimensión. 
La dimensión de un espacio V de dimensión finita es el mayor n, tal que un 


de sia 


haati i 


baam A a n 
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n-tuple de vectores de V es linealmente independiente, y así sucesivamente. 
El lector que crea que este párrafo no es más que palabras, puede preguntarse 
si los vectores 


a = (er, 1) 


os = (V110, 1) 


son linealmente independientes en R?. 

Los elementos de una sucesión están enumerados en un orden determina- 
do. Un conjunto es una colección de objetos con una disposición no determi- 
nada u ordenada. Claro que al describir el conjunto se deben indicar sus ele- 
mentos, y ello requiere elegir un orden. Pero el orden no es parte del conjunto. 
Los conjuntos (1, 2, 3, 4) y (4, 3, 2, 1) son idénticos, mientras que 1, 2, 3, 4 es 
una sucesión muy diferente de 4, 3, 2, 1. El aspecto ordinal de las sucesiones 
no entra en juego en los asuntos de independencia, dependencia, etc., porque 
la dependencia (como se definió) no está afectada por el orden. La sucesión 
Un» » » »» Q, es dependiente si, y solo si, la sucesión &;, ..., %, es dependiente. 
En la sección siguiente, el orden será importante. 


Ejercicios 


1. Demostrar que si dos vectores son linealmente dependientes, uno de ellos es un múlti- 
plo escalar del otro. 


2. ¿Son los vectores 


aœ = (1,1,2,4), œ = (2, —1, —5, 2) 
œ = (1, —1, —4,0), œ = (2, 1, 1, 6) 


linealmente independientes en R*? 


3. Hallar una base para el subespacio de R* generado por los cuatro vectores del Ejer- 
cicio 2. 


4. Demostrar que los vectores 


a = (1,0, —1), œ= (1,2,1), œ = (0, —3, 2) 
forman una base para R?. Expresar cada uno de los vectores de la base canónica como 


combinación lineal de %,, %, y %3. 


5. Hallar tres vectores de R? que sean linealmente dependientes y tales que dos cuales- 
quiera de ellos sean linealmente independientes. 


6. Sea V el espacio vectorial de todas las matrices 2 x 2 sobre el cuerpo F. Demostrar 
que V tiene dimensión 4, encontrando una base de V que tenga cuatro elementos. 


7. Sea V el espacio vectorial del Ejercicio 6. Sea W, el conjunto de las matrices de la 
forma 


A i 
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y sea MW, el conjunto de las matrices de la forma 


a b], 
—a c 
ta) Demostrar que W, y W, son subespacios de V. 
tb) Hallar la dimensión de W,, Wz, W, + Wi y Wi O Wa- 
B. Nuevamente, sea V el espacio de las matrices 2 x 2 sobre F. Hallar una base (41, 42, 
I, A,] de V, de modo que 4% = Aj para cada j. 
9. Sea V un espacio vectorial sobre el cuerpo F de los números complejos. Supóngase 


que x, f y y sean vectores linealmente independientes en V. Demostrar que (« + B.(B + y 
y ly + 2) son linealmente independientes. 


10. Sea V un espacio vectorial sobre el cuerpo F. Supóngase que hay un número finito 
dle vectores at, ..., a, en V que generan V. Demostrar que V es de dimensión finita. 


11. Sea V el conjunto de todas las matrices 2 x 2, A, con elementos complejos que sa- 
tistacen A,, + A22 = 0. 

(a) Hacer ver que V es un espacio vectorial sobre el cuerpo de los números reales, con 
las operaciones comunes de adición de matrices y multiplicación de matrices por un escalar. 

(b) Hallar una base de este espacio vectorial. 

(c) Sea W el conjunto de todas las matrices A de V tales que 47, = —4A2, (la barra 
indica complejo conjugado). Demostrar que W es un subespacio de V y hallar una base de W. 


12. Demostrar que el espacio de todas las matrices m x n sobre el cuerpo F tiene dimen- 
sión mn, presentando una base para este espacio. 

13. Analizar el Ejercicio 9, cuando V es un espacio vectorial sobre el cuerpo de dos ele- 
mentos, descrito en el Ejercicio 5, Sección 1.1. 


14. Sea V el conjunto de los números reales. Considerar Y como un espacio vectorial 


sobre el cuerpo de los números racionales. con las operaciones usuales. Demostrar que este 
espacio vectorial no es de dimensión finita. 


2.4. Coordenadas 


Una de las características útiles de una base @ en un espacio V de dimensión 
n es que permite esencialmente introducir coordenadas en V en forma análo- 
ga a las «coordenadas naturales», x;, de un vector a = (Xis - - -s Xn) en el es- 
pacio F”. En este esquema, las coordenadas de un vector a en V, respecto de 
la base @, serán los escalares que sirven para expresar a como combinación 
lineal de los vectores de la base. Así, pues, sería de considerar las coordenadas 
naturales de un vector a en F” como definidas por a y la base canónica de F"; 
sin embargo, al adoptar este punto de vista se debe tener mucho cuidado. Si 


a=(%.-.-, Tn) = È ziti 


y Bes la base canónica de F", ¿cómo quedan determinadas las coordenadas 
de a por @ y a? Una manera de formular la respuesta es la siguiente. Un vector 
dado, «a, tiene una expresión única como combinación lineal de los vectores 
de la base canónica, y la coordenada ¡-ésima x; de « es el coeficiente de €, en 


A 0 AAA AA ES AA AA AAA AA ASAS AAA AAA ¡AS 


50 http://libreria-universitaria.blogspot.com Algebra lineal 


esta expresión. Desde este punto de vista, se puede decir cual es la ¿-ésima coor- 
denada, porque se tiene un orden «natural» de los vectores de la base canónica, 
esto es, se tiene una regla para determinar cuál es el «primer» vector en la base, 
cuál es el «segundo» vector, y así sucesivamente. Si @ es una base arbitraria 
del espacio V de dimensión n, no se tendrá probablemente. un orden natural 
de los vectores de (4, y, por tanto, será necesario imponer algún orden a estos 
vectores antes que se pueda definir la «i-ésima coordenada de a respecto a B». 
Para plantearlo de otra forma, se definirán las coordenadas respecto a una 
sucesión de vectores y no de un conjunto de vectores. 


Definición. Si V es un espacio vectorial de dimensión finita, una base or- 
denada de V es una sucesión finita de vectores linealmente independiente y que 
genera V. 


Si la sucesión &;, ..., æ, es una base ordenada de V, entonces el conjunto 
{ais -.., Aj es una base de V. La base ordenada es el conjunto, juntamente 
con el orden dado. Se incurrirá en uń pequeño abuso de notación y se escribirá 


GB = {an --., an} 


diciendo que (3 es una base ordenada de V. 
Ahora supóngase que V es un espacio vectorial de dimensión finita sobre 
el cuerpo F y que 


G = (01, ..- , an}. 


es una base ordenada de V. Dado «a de V, existe un único n-tuple (x1, ..., Xn) 
de escalares tal que 


n 
a= Y zia; 
i=1 


Este n-tuple es único, ya que si también se tiene 


n 
a= Y 20; 
i=1 
entonces 
n 
Y (z: — zija; = 0 
i=1 


y la independencia lineal de los a, asegura que x; — z; = 0, para todo i. Se Ila- 
mará a x; la ¡-ésima coordenada de a respecto a la base ordenada 


G = (01,...,0n) 
Si 
B= 2, Yili 


entonces k 
a+8ß= 2 (z: + yia: 


(2-13) o Ey 3 P ¡Qs 
i=l 


Bean Xp... 


A a ad 
s1 


ade modo que la ésima coordenada de (x + f) en esta base ordenada es Xit yi). 


En forma análoga, la ¡-ésima coordenada de (ca) es cx;. Debe observarse tam- 
bién que, cada n-tuple (X,, . . . , x,) de F” es el n-tuple de coordenadas de algún 
vector de V, a saber, el vector 
2 Lit. 
Resumiendo, cada base ordenada de V determina una correspondencia 
biunivoca 


a (2, ...,2n) 


untre el conjunto de todos los vectores de V y el conjunto de todos los n-tuples 
de F". Esta correspondencia tiene la propiedad de que el correspondiente de 
lx + f) es la suma en F” de los correspondientes de a y f, y el correspondiente 
do (ca) es el producto en F” del escalar c y el correspondiente de «a. 

Cabría preguntarse, en este momento, ¿por qué no se elige simplemente 
alguna base ordenada de V y se expresa todo V por su correspondiente n-tuple 
dle coordenadas, ya que así se tiene la conveniencia de operar solo con n-tuples? 
Esto iría contra nuestro propósito por dos razones. Primera, como la defini- 
vión axiomática de espacios vectoriales indica, se trata de aprender a razonar 
von espacios vectoriales como sistemas algebraicos abstractos. Segunda, in- 
Uluso en aquellos casos en que se usan coordenadas, los resultados más impor- 
tantes se obtienen de la capacidad que se tenga de cambiar sistemas de coor- 
denadas, es decir, de cambiar la base ordenada. 

A menudo, será de mayor conveniencia usar la matriz de las coordenadas 
de a respecto a la base ordenada (GH: 


In vez del n-tuple (Xis ---, Xn) de coordenadas. Para indicar la dependencia 
de esta matriz de coordenadas respecto de la base se usará el símbolo 

lala 
para la matriz de coordenadas del vector a respecto a la base ordenada 6. Esta 
notación será particularmente útil cuando procedamos ahora a describir qué 


lo sucede a las coordenadas de un vector a cuando se cambia de una base orde- 
mada a otra. 


Supóngase, entonces, que V es de dimensión n y que 
G = fan... an} y 8'=(d,..., 0) 
ean dos bases ordenadas de V. Existen escalares únicos P; tales que 
1<j<nm 


-> X las coordenadas de un vector dado a en la base ordenada @'. 
Entonces 


h dl 
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= rol e. A g E mos x m a 
a = zioa + + tian Para completar el análisis anterior, se demostrará también el siguiente 
sl rema. 
-= 2 Taj 
J= * a e , 
7 X Teorema 8. Supóngase que P es una matriz inversible n x n sobre F. Sea 


V un espacio vectorial de dimensión n sobre F, y sea @ una base ordenada de V. 


[i] 
M 
a 

M 
k 
È 


j=l i=l Entonces existe una base ordenada @', única, de V tal que 
n n i 
= Z 2 Piojos i) [ele = Plelg: 
Rs ni) [ely = P~ ikla 
y 3 ( n Pii) e para todo vector a en V. 
i=1 Nj=1 
i de , Demostración. Sea @, que consta de los vectores %,, ..., On Si @' = 
Se tiene así la relación Mi. ..., æn} es una base ordenada de V, para la cual se tiene (i), es claro que 
= $ $ Qs A a > 
(2-14) a= 2 2i P we) Qi. a = Di Pijai. 


Como las coordenadas Xy, Xz, - --, Xn de a en la base ordenada G están uni- 


Ani, solo se necesita demostrar que los vectores a;, definidos por estas igual- 
vocamente determinadas, se sigue de (2-14) que 


dades, forman una base. Sea Q = P”?. Entonces 


n A = - P E 
(2-15) m= E Pah 1<i<n Z ur = q Qa E Pyas 
A $ = ZE Pi Qu as 
Sea P la matriz n x n cuyo i, j elemento es el escalar P,; y sean X y X’ las ma- jos 
trices de coordenadas del vector « en las bases ordenadas @ y ('. Entonces se =3 (e Pix) ai 
puede escribir (2-15) como iby 
= Ok. 


(2-16) X = PX'. 
Como 6 y @' son conjuntos linealmente independientes, X = 0, si, y solo si, 
X' = 0. Así, de (2-16) y del Teorema 7 del Capitulo 1, se sigue que P es inver- 
sible. Luego 

(2-17) X= ¿PROS 


Si se usa la notación introducida anteriormente para la matriz de coordenadas 
de un vector respecto a una base ordenada, entonces (2-16) y (2-17) dicen que 


[ala = Plalo 
[ala = Pale. 
Con lo que lo anterior puede resumirse así. 


Con lo que el subespacio generado por el conjunto 

8 = (aí,..., 05) 
Sontiene a B y, por tanto, es igual a V. Así que @' es una base, y por su defini- 
tión y por el Teorema 7 es claro que (i) es válido y también lo es (ii). PP 

Ejemplo 18. Sea F un cuerpo y sea 

a = (Zy, To, ..., En) 

un vector de F”. Si @ es la base ordenada canónica de F", 
G= {en -- , €n) 

la matriz de coordenadas del vector œ en la base @ está dada por 


Teorema 7. Sea V un espacio vectorial de dimensión n sobre el cuerpo F, EA 
y sean B y @' bases ordenadas de V. Entonces existe una única matriz n x n, tala =|” 
necesariamente inversible, con elementos de F, de modo que ye T 
š Tn, 
G) [ola = Piele A 
(ii) [lg = P7 [219 Ejemplo 19. Sea R el cuerpo de los números reales y sea O un número real 


dado. La matriz 
para todo vector a de V. Las columnas de P están dadas por 
P= cos —senð 


Pe iele IFE t = |senó  cos6 


UA. sd 
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es inversible con inversa, 


P=] cos O aA 
= L—sno cose 


Así que para cada 0, el conjunto @’ que consta de los vectores (cos 6, sen 0), 
(sen 6, cos 8) es una base de R?; intuitivamente esta base puede ser descrita 
como la obtenida por rotación de ángulo O de la base canónica. Si a es el vector 


(xı; X2), entonces 
_[ cosó sen 4 [a 
dor cosb Za 


zi 21 COS O + za sen 0 
2 = —2 sen Ó + qz cos 6. 


Ejemplo 20. Sea F un subcuerpo de los números complejos. La matriz 


-1 4 5 
P= 02 3 
0 0 8 
es inversible con inversa 
11204 
pu=| 04 vel 
00 2 
Así los vectores 
ai = (—1, 0,0) 
a= ( 4, 2,0) 


as =( 5, —3, 8) 


forman una base @' de F3. Las coordenadas x4, x}, x3 del vector a = (x1, X2, X3) 
en la base @' vienen dadas por 


zi —2, + 222 + r -1 2 4 j||z 
j= das + Tots = 0 éllel 
EA das 0 0 ¿]La 


En particular 
(3, 2, —8) = —10ai — das — as. 


Ejercicios 
1. Demostrar que los vectores 


œ = (1, 1,0, 0), 
as = (1, 0, 0, 4), 


az = (0,0, 1, 1) 
a = (0,0,0,2) 


forman una base de R*. Hallar las coordenadas de cada uno de los vectores de la base ca- 
nónica respecto de la base ordenada (0,, %, %, %a)- 


Espacios vectoriales 


2. Hallar la matriz de coordenadas del vector (1, 0, 1) en la base de C? formada por los 
vectores (24, 1, 0), (2, —1, 1), (0, 1 + į, 1 — i), en ese orden. 


Y Sea @ = (01, 97, a) la base ordenada de R? formada por 
a = (1,0, —1) œ= (1,1,1), œ= (1,0,0). 
¿Cuales son las coordenadas del vector (a, b, c) en la base ordenada @? 


A. Sca W el subespacio de C? generado por a, = (1, O, i) y ap = (1 +i, 1, —1). 
(a) Demostrar que a, y a, forman una base de W. 


(b) Demostrar que los vectores $, = (1, 1, 0) y $2 = (1, i 1 +1) pertenecen a W 
y forman otra base de W. 


(c) ¿Cuáles son las coordenadas de a, y a, en la base ordenada (Bi, B2} de W? 
8, Scan a = (%,, x2) y B = (Yı, yz) dos vectores de R? tales que 
a+ta=y4+g=1L 


Demostrar que @ = (a, $} es una base de R?. Hallar las coordenadas del vector (a, b) en 
la base ordenada @ = (a, £}. (Las condiciones impuestas a a y B dicen, geométricamente, 
iue x y f son perpendiculares y de longitud 1.) 


TN + 242 = 0, 


b. Sea V el espacio vectorial sobre los números complejos de todas las funciones de R 
sn C; es decir, el espacio de todas las funciones sobre el eje real a valor compleja. Sea 
Mi) = 1, Lx) = e, f(x) = e. 

(a) Demostrar que fı, f2 y fa son linealmente independientes. 

(b) Sea g,(x) = 1, g,(x) = cos x, g(x) = sen x. Hallar una matriz inversible 3 x LP 
tal que 


3 
g= È Pifo 
i=l 


7. Sea V el espacio vectorial (real) de todas las funciones polinomios de R en R de grado 
1 o menor; es decir, el espacio de todas las funciones de la forma 


f(z) = co + az + 
Sca 1 un número real fijo y defínase 


gl) =x2+t  glx)=(2402 


Demostrar que @ = (g,, 22, g3} es una base de V. Si 


nl) =1, 


Fx) = co + ox + or? 


¿Cuáles son las coordenadas de f en esta base ordenada @? 


2.5. Resumen de equivalencia por filas 


En esta sección se usarán unos hechos elementales referentes a bases y di- 
mensión en espacios vectoriales de dimensión finita para completar el trata- 
miento de la equivalencia de matrices por filas. Se recuerda que si Æ es una 


matriz m x n sobre el cuerpo F, los vectores fila de A son los vectores Olas; tas O 
de F” definidos por 


os = (As, . - -, Ain). 


MBA a ATA A AAA AAA AAA AS A AA td AAA AAA > 
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y que el espacio de filas de A es el subespacio de F" generado por estos vecto- 
res, El rango de fila de A es la dimensión del espacio de filas de A. 

Si P es una matriz k x m sobre F, entonces el producto B = PA es una ma- 
triz k x n cuyos vectores fila f,, ...- B, son combinaciones lineales 


B: = Pa + -+ + Piman 


de los vectores fila de A. Así el espacio de filas de B es un subespacio del espacio 
de filas de A. Si P es una matriz inversible m x m, entonces B es equivalente 
por filas a A, de modo que la simetría de la equivalencia por filas, o la igualdad 
A = P7YB, indica que el espacio de filas de A es también un subespacio del 
espacio de filas de B. 


Teorema 9. Las matrices equivalentes por filas tienen el mismo “spacio 
de filas. 


De este modo se ha visto que para estudiar el espacio de filas de A se puede 
estudiar el espacio de filas de una matriz escalón reducida por filas que es equi- 
valente por filas a A, como se hará en seguida. 


Teorema 10. Sea R una matriz escalón no nula reducida por filas. Enton- 
ces los vectores fila no nulos de R forman una base del espacio de filas de R. 


Demostración. Sean pi, ...., P, los vectores fila no nulos de R 


pi = (Ra,.-., Rin). 


Ciertamente estos vectores generan el espacio de filas de R; se necesita solo 
demostrar que son linealmente independientes. Como R es una matriz escalón 
reducida por filas, hay enteros positivos kı, ..-, k, tales que, para i < r 


(2) RG j) =0 si j <k 
(2-18) (b) RG, ki) = 85 
(c) ki < --- < kn 
Supóngase que ß = (bı, ..., bn) sea un vector del espacio de filas de R: 
(2-19) B = am t+ e + Cpr 


Se afirma entonces que c; = b,,. En efecto, por (2-18) 


(2-20) bu = E RÇ, k;) 
i=l 
5 y Ciðij 
i=1 
= cj. 
En particular, si = 0, es decir, si c,p, + +** + €p, = 0, entonces c; debe 
ser la k-ésima coordenada del vector nulo, con lo que c; = 0, j = 1. ..., r. 


Así, pues, Pi, ---, pP, SOn linealmente independientes. Ë 
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Teorema IH. Sean m y n dos enteros positivos y sea F un cuerpo. Supóngase 


que W es un subespacio de F" y que dim W < m. Entonces existe exactamente 


una sola matriz escalón m x n reducida por filas sobre F que tiene a W como 
we espacio de filas. 


Demostración. Hay al menos una matriz escalón reducida por fila 
m x n con espacio de filas W. Como dim W < m, se pueden elegir m vectores 
Mis... + Xm de W que generan W. Sea A la matriz m x n con vectores fila 0,,..., 
“w y sea R la matriz escalón reducida por filas que es equivalente por filas a A. 
Entonces, el espacio de filas de R es W. , 

Sea ahora R cualquier matriz escalón reducida por filas que tiene a W como 
“u espacio de filas. Sean py, ..., p, los vectores fila no nulos de R y supóngase 
que el elemento principal no nulo de p; esté en la columna k;, i = 1, ..., r. 
Los vectores Py, .. .. p, forman una base de W. En la demostración del Teore- 
ma 10 se observó que si B = (b,, ..., bn) pertenece a W, entonces 


B = apm + *:* t Cpr 


y «, = b,,; en otras palabras, la expresión única de $ como combinación lineal 
de los Pi, .-., P, €S 


r 
(2-21) B= È dupi. 
i=l 

Asi, pues, cada vector f está determinado si se conocen las coordenadas by, 
i= 1,...,r. Por ejemplo, p, es el vector único de W que tiene la k,-ésima coor- 
denada 1 y las k¡-ésimas coordenadas 0 para Ù+ s. 

Supóngase que ff pertenece a W y que f + 0. Se afirma que la primera coor- 
denada no nula de £ está en una de las columnas k,. Como 

B="2 _brpi 
i=l 

y [$ + 0 se puede escribir 


(2-22) B= È bios 


i=s 


ba, = 0. 


De las condiciones (2-18) se tiene R; = 0 si i >s y j > k,. Con lo que 


BO is aci OÍ Dicc 3 Da), br, 0 


y la primera coordenada no nula de £$ está en la columna k,. Obsérvese también 
que para cada k,, s = 1, ..., r, existe un vector en W que tiene su k,-ésima 
coordenada no nula, a saber p,. " 

Ahora es claro que R está determinada univocamente por W. La descrip- 
ción de R en términos de W es como sigue. Se consideran todos los vectores 
B = (b,,...,b,) en W. Si B + 0, entonces la primera coordenada no nula debe 
estar en alguna columna f: 


p=(0,...,0, di... , 0n), b, 0. 


Sean k4, .. ., k, aquellos enteros positivos £ tales que existe algún ß + 0 en W, 


DAA ISA. ss a 


a A AA O. AAA AA AAA A 


— -A 
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cuya primera coordenada no nula está en la columna t. Se disponen los k4, . . . , k, 
en el orden k, < k <-*-*+ < k. Para cada uno de los enteros positivos k, 
habrá un vector p, y solo uno de W tal que la k,-ésima coordenada de p, es 1 y 
la k,-ésima es 0 para i + s. Entonces R es la matriz m x n que tiene los vecto- 
res fila pis ..., P,, 0, ..., 0. B 


Corolario. Cada matriz m x n, A, es equivalente por filas a una, y sola- 
mente una, matriz escalón reducida por filas. 


Demostración. Sabemos que A es equivalente por filas, al menos, a una 
matriz escalón reducida por filas. Si Æ es equivalente por filas a otra matriz 
escalón R’, entonces R es equivalente por filas a R”; luego, R y R’ tienen el mis- 
mo espacio de filas y deben ser idénticas. Į 


Corolario. Sean A y B matrices m x n sobre el cuerpo F. Entonces A y B 
son equivalentes por filas si, y solo si, tienen el mismo espacio de filas. 


Demostración. Se sabe que si A y B son equivalentes por filas, entonces 
tienen el mismo espacio de filas. Supóngase ahora que A y B tengan el mismo 
espacio de filas. Ahora A es equivalente por filas a una matriz escalón reducida 
por filas R, y B es equivalente por filas a una matriz reducida por filas R’. Como 
A y B tienen el mismo espacio de filas, R y R’ tienen el mismo espacio de filas. 
Con lo que R = R' y A es equivalente por filas a B. | 

En resumen, si A y B son dos matrices m x n sobre el cuerpo F, las siguien- 
tes afirmaciones son equivalentes: 


1. A y B son equivalentes por filas. 
2. A y B tienen el mismo espacio de filas. 
3. B=PA, donde P es una matriz inversible m x m. 


Una cuarta afirmación equivalente es que los sistemas homogéneos AX = 0 
y BX = 0 tienen las mismas soluciones; sin embargo, aun cuando se sabe que 
la equivalencia por filas de A y B implica que estos sistemas tienen las mismas 
soluciones, es más conveniente dejar la demostración del recíproco para más 
adelante. 


2.6. Cálculos relativos a subespacios k 


Queremos ahora mostrar cómo las operaciones elementales por filas dan un 
método normalizado para responder a ciertas preguntas concretas concer- 
nientes a subespacios de F". Ya hemos deducido lo que vamos a necesitar. El 
análisis es válido para cualquier espacio vectorial V de dimensión n sobre el 
cuerpo F, si se elige una base ordenada GB fija y se expresa cada vector a de V 
por la n-tuple (x,, . . ., X„) que da las coordenadas de a en la base ordenada @. 

Supóngase que se han dado m vectores d,, ..., Q,, pertenecientes a F”. Con- 
sideremos las siguientes preguntas: 

1. ¿Cómo se determina si los vectores %,, ..., %,, son linealmente inde- 
pendientes? O en términos generales, ¿cómo se determina la dimensión del 
subespacio W generado por estos vectores? 
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2. Dado f en F”, ¿cómo se determina si f3 es una combinación lineal de 
Mi. «+ Ay, es decir, si 8 pertenece al subespacio W? 
3. ¿Cómo se puede dar una descripción explícita del subespacio W? 


La tercera pregunta es algo vaga, ya que no se especifica qué se entiende 
por una «descripción explícita»; sin embargo, ello se aclarará cuando se dé 
el tipo de descripción que se tiene en mente. Con esta descripción las pregun- 
ts (1) y (2) pueden contestarse inmediatamente. 

Sea A una matriz m x n con vectores fila a,: 


a; = (An, -.., Ain) 


Mágase una sucesión de operaciones elementales por fila, empezando con A 
pura terminar con una matriz escalón reducida por fila R. Anteriormente ya 
se indicó cómo se hace esto; ahora, la dimensión de W (el espacio de filas de 4) 
queda de manifiesto, ya que esta dimensión es simplemente el número de vec- 
tores fila no nulos de R. Si p,, ..., p, son los vectores fila no nulos de R, en- 
tonces AB = [p,, .... p,) es una base de W. Si la primera coordenada no nula 
de p, es la coordenada kpésima, se tiene entonces para i < r 


in) Ri, j)=0, si j< ki 
ib) R(i, k;) = 855 
(e) ki < -e < km 
V'l subespacio W consta de todos los vectores 


B= amti + Op 
jrd y UR Rin). 


i=l 


Las coordenadas b,, ..., b, de tal vector ff, son entonces 


r 
(2-23) bi = E GR. 

i=l 
En particular, b, = cj, y así, si B = (b,, ..., bn) es una combinación lineal 
de los p;, debe ser la combinación lineal particular 


(2-24) B= 2 bripi- 

Las condiciones sobre 8 que (2-24) ha de tener son 

(2-25) A A A 
i=l 


Ahora (2-25) es la descripción explícita del subespacio W generado por 
Mis .--> Gm, esto es, el subespacio consta de todos los vectores f de F” cuyas 
coordenadas satisfacen (2-25). ¿Qué tipo de descripción es (2-25)? En primer 
lugar describe W como todas las soluciones f = (b,, ..., bn) del sistema de 
ecuaciones lineales homogéneas (2-25). Este sistema de ecuaciones es de una 
naturaleza muy especial, porque expresa (n — r) de las coordenadas como 
combinaciones lineales de las r coordenadas señaladas, by1, ..., br,- Se tiene 
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completa libertad para elegir las coordenadas b,; esto es, Si €,, ..., €, SON F €s- 
calares cualesquiera, existe un veetor $ de W y solo uno que tiene c; como su 
k¡-ésima coordenada. 

Lo significativo, aquí, es que: dados los vectores a;, la reducción por fila 
əs un método directo para determinar los enteros r, k,, ..., k, y los escalares 
R; que dan la descripción (2-25) del subespacio generado por &;, .. . , %y. Debe- 
mos observar, como hicimos en el Teorema 11, que todo subespacio W de F” 
tiene una descripción del tipo (2-25). También debemos hacer notar algunos 
aspectos respecto a la pregunta (2). Se ha determinado, en la Sección 1.4, cómo 
se puede hallar una matriz inversible m x m, P, tal que R = PA. El conoci- 
miento de P permite encontrar los escalares x,, ..., Xm tales que 


B = 201 F +- + Emam 


cuando ello es posible. En efecto, los vectores fila de R están dados por 
m 
pi: = È Pia; 
j=1 
de modo que si $ es una combinación lineal de los a,, se tiene 


BS z bripi 
i=1 


r m 
= 2 brn D Pia; 


i=l j=i 


m r 
= 7 beP ija; 


j=l i=l 
r 
zj; = 2 bk:Pi; 
= 


es una posible elección de los x; (puede haber varias). 

La cuestión de si f = (b,, ..., b,) es una combinación lineal de las œ, y 
en tal caso cuáles son los escalares x; se puede también considerar preguntán- 
dose si el sistema de ecuaciones 


con lo que 


E, Auti = bp j=1,...,n 


tiene solución y cuáles son las soluciones. La matriz coeficiente de este sistema 
es la matriz n x m, B, con vectores columna 0, ..., Om. En el Capítulo 1 se 
estudió el uso de las operaciones elementales por fila para resolver un sistema 
de ecuaciones BX = Y. Consideremos un ejemplo en el cual adoptamos ambos 
puntos de vista para responder preguntas respecto a subespacios de F”. 


Ejemplo 21. Consideremos el siguiente problema. Sea W el subespacio 
de R* generado por los vectores 


a = (1, 2, 2, 1) 
a = (0, 2, 0, 1) 
as = (—2, 0, —4, 3). 


vectoriales 


(a) Demostrar que &;, %,, , forman una base de W, es decir, que estos 
vectores son linealmente independientes. 

(b) Sea 8 = (b,, b,, bz, b4) un vector de W. ¿Cuáles son las coordenadas 
ale ff respecto a la base ordenada ([a,, %,, %3}? 
(c) Sean 


Demostrar que a;, a, a forman una base de W. 

(d) Si f pertenece a W, se designa por X la matriz de coordenadas de f 
respecto a la base de los a, y por X’ a la matriz de coordenadas de ff respecto 
m la base de los g’. Hallar la matriz 3 x 3, P, tal que X = PX” para cada una 
de tales £8. 

Para responder estas preguntas por el primer método se forma la matriz A 
von vectores fila a,, a, %3, se determina la matriz escalón reducida por filas R, 
que es equivalente por filas a A, y haciendo las mismas operaciones sobre la 
matriz identidad se obtiene la matriz inversible Q, tal que R = QA: 


de q 2 1 10206 
02 01|>rR=J0100 
—2 0 -4 3 0001 


(a) Evidentemente R es de rango 3, con lo que %,, %,, %3 son indepen- 
dientes. 

(b) ¿Qué vectores $ = (b,, bz, ba, b4) pertenecen a W? Se tiene la base 
de W dada por p4, P2, P3, que son los vectores fila de R. A la vista está que el 
espacio generado por p,, P2, P3 consta de los vectores $ para los que b, = 2b,. 
Para un f tal, se tiene 

B = bip, + b2p2 + bapa 
lbi, da, AIR. 
[bi bz b1]QA 


= 2101 + Taa + 2303 


ll 


donde x; = [b, b, b3]0;: 


m= bi — $b + ¿ds 
(2-26) t = —b, + $b: — ¿da 
wT — ¿ds + ¿ds 


(c) Los vectores «i, a, «4 son todos de la forma (y1, Yz, Ya, Ya) COn yz = 2y}, 
y, por tanto, pertenecen a W. Es evidente que son linealmente independientes. 
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(d) La matriz P tiene por columnas 
P; = [aje 
donde @ = (0,, a,, a3). Las ecuaciones (2-26 dicen cómo hallar la matriz de 


coordenadas para «1, «3, a. Por ejemplo, con $ = a; se tiene b, = 1, b, = 0, 
b, = 2, b, = 0, y 


z= 1-H0)+40)= 1 
z = —1 +40) — 4(0) = —1 
z= —$0) +30) = 0. 


Con lo que a, = æ, — a,. En forma semejante, se obtiene az = % y a = 


20, — 20, + 0. Luego 
10 2 
P= |- 1 -2| 
0.0 1 


Ahora se verá cómo se responden las preguntas por el segundo método des- 
crito. Se forma la matriz 4 x 3, B, con vectores columna CAES 


1 0 -2 
22. 0 
PELS O tal 
tor 3 
Inquirimos para cuáles y,, y,, Y3, Ya el sistema BX = Y tiene una solución. 
10 -2 y 10 -2 Y 
2 2 0 y 10% 2 4 Y — 2y1 A 
s 2 0 —4 y 0.0 0 Yy—2y 
11 3 y 0 1 5 Y-Y 
1 0 -2 Y 100 y— iy + in 
0 0 —6 y= 2u Pe 001 Elu — ya) 
01 5 y-n 0 1 0 ~y +§u:— ¿y 
0 0 0 y -— 2y 0 0 Ya — 241 


Así la condición para que el sistema BX = Y tenga una solución es que y3=2y,. 
Así $ = (b,, bz, bz, b4) pertenece a W si y, solo si, b, = 2b,. Si f pertenece a 
W, entonces las coordenadas (x,, x}, x3) en la base ordenada (0,, Az, 03) se 
pueden leer de la última matriz anterior. Obtenemos nuevamente las fórmu- 
las (2-26) para esas coordenadas. 

Las preguntas (c) y (d) se responden como antes. 


Ejemplo 22. Consideremos la matriz 5 x 5 


1.2 0 30 
Ya =1 —1 0 
A=|0 0 1 4 0 
2 4 L 10 1 
0 0 0 0 1 


y los siguientes problemas concernientes a A. 


(a) Hallar una matriz inversibie P, tal que PA sca una matriz escalón 
reducida por filas R. ' 

(b) Hallar una base para ei espacio de filas W de A. 

(e) Determinar qué vectores (b,, bz, b3, ba, bs) están en W. 

(d) Hallar la matriz de coordenadas de cada vector (bi, bz, bz, ba, bs) 
de W en la base ordenada elegida en (b). “3 

(e) Escribir cada vector (bı, b2, b3, ba, bs) de W como una combinación 
lineal de las filas de A. y > 

(f) Dar una descripción explícita del espacio vectorial V de todas las ma- 
trices columnas de 5 x 1, X, tales que AX = 0. 

(g) Hallar una base de V. la A 

(h) ¿Para qué matriz columna 5 x 1, Y, la ecuación AX = Y tiene so- 
Juciones X? 

Para resolver estos problemas se forma la matriz aumentada A' del sis- 
tema AX = Y y efectuando una sucesión apropiada de operaciones por filas 
sobre A“: 


Xx 2 0 0 y 1 2 0 3.0 Y 
| 2 -1-10pBm 00-17-40 p4+x 
CA E AE A E 
24 1 101 y 00 1 41 -m+n 
00 0 01 y EU E 
12030 Y 
00140 Y — Ya 
0.0000 —Yy+Y+Y | 
00001 —3Y+Y+Y 
00001 Ys 
12030 Y 
00140 Ya — Ya 
00001 Yo 
00000 —Y + Ya + Ya 
0 0 0 0 0 —3y+Y+ Y — Ys, 
(a) Si 
Y 
Y — Ya 
PY = Yo 
=y + Ya + Ya 


—3YN + Ya + Ya — Yo 
para todo Y, entonces 


1. 000 0 
11-100 0 
P=| 0 000 1 
Eto LO 
OS 10 
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luego PA es la matriz escalón reducida por filas 


12030 
00140 
R=|0 0001 
00000 
00000 


Se debe resaltar que la matriz P no es única. Existen, de hecho, muchas matri- 
ces inversibles P (que provienen de los diferentes modos de elegir las opera- 
ciones usadas para reducir 4”) tales que PA = R. 

(b) Una base de W se puede tenér al tomar las filas no nulas 
(12 0 3 0) 
=0 0 1 4 0) 
p»=(0 0 0 0 1) 


Pı 


de R. 
(c) El espacio de filas W consta de todos los vectores de la forma 
B = Cp + p + Cops 
= (Ci, 2C1, C2, 361 + 4c2, Ca) 
donde c,, c2, cz son escalares arbitrarios. Así, (b,, b2, b3, ba, bs) pertenece a W 
si y, solo si, 
(bu, bz, da, ba, bs) = bipi + bap: + dopo 
lo que es cierto si y, solo sı, 
b: = 2b, 
bi = 3b, + 4ba. 
Estas ecuaciones son casos particulares del sistema general (2-25), que se puede 
Usar para ver inmediatamente si un vector dado pertenece a W. Así, (—5, — 10, 
1, — 11, 20) es una combinación lineal de las filas de A, pero (1, 2, 3, 4, 5) no lo es. 
(d) La matriz de coordenadas del vector (b,, 2b,, b3, 3b, + 4b3, bs) en 
la base p, Pz, P3 es evidentemente 


y 


(e) Hay varias maneras de escribir los vectores de W como combinacio- 
nes lineales de las filas de A. Tal vez el método más fácil es seguir el primer pro- 
cedimiento del Ejemplo 21 anterior: 


B = (bi, 2br, ba, 3b, + 4b, bs) 
3 [b,, bs, bs, 0, 0] -R 
= [b, bs, bs, 0, 0] - PA 


1.000 0 
1-100 0 

= [b ba, ds, 0,0} 0 000  1|-4 
-0 a aoa o 
=3 40.1 -=1 


= [b + ds, —ba, 0, O, bs] - A. 


particular, con f = (5, —10, 1, —11, 20) se tiene 


12 0 30 | 
12 =1 =10 
B=(-4,-1,0,0,20)/0 0 1 4 0| 
aa 18 1051 
00 0 01 


(1) Las ecuaciones en el sistema RX = 0 son: 


21 + 222 + 324 = 0 
za + 4r = 0 
zs = 0. 


Con lo que V consta de todas las columnas de la forma 


—22 — 324 

La 

X= — 4t, E 
Ya 
0 
onde x, y x, son arbitrarios. 

(g) Las columnas $ +8 
1 0 
0 4 
0 1 
0 O, 


[orman una base para Y. Este es un ejemplo de la base descrita en el Ejemplo 15. 
l (h) La' ecuación AX = Y tiene las soluciones X si y, solo si, 


=y + Ya + Ya =0 
—3YN + Ya + Ya — Ys = 0. 


Ejercicios 


L Seas <n y A una matriz s x n con elementos en el cuerpo F. Usando el Teorema 4 
s Seas ; E E 
Ino su demostración), demostrar que existe un X no nulo en F"** tal que AX = 0. 


b Scan 


a = (1,1, —2, 1), as = (—1, 2, 5, 2). 


a: = (3,0, 4, —1), 
y scan 


a= (4, —5,9, —7), B= (3,1, —4,4), v= (—1,1,0, 1). 


(a) ¿Cuál de los vectores a, f, y pertenece al subespacio R* generado por los 0? 
(b) ¿Cuáles de los vectores a, f, y están en el subespacio de C* generado por los 0,? 
(c) ¿Sugiere esto algún teorema? 
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3. Considerar los vectores en R* definidos por 


a = (—1,0, 1,2), aœ: = (3,4, —2, 5), a: = (1,4,0, 9). 


Hallar un sistema de ecuaciones lineales homogéneas para las que el espacio de las solu- 
ciones sea exactamente el subespacio de R* generado por los tres vectores dados. 
4. En C?, sean 

a = (1,0, ~i), 


a=(14+11-4D, œ= (iii). 


Demostrar que estos vectores forman una base de C?. ¿Cuáles son las coordenadas del 
vector (a, b, c) en esta base? 
5. Dar una descripción explícita del tipo (2-25) para los vectores 
B = (bi, ba, ba, Da, ds) 
de R$ que son combinaciones lineales de los vectores 


a = (1,0, 2, 1, —1), 
a = (2, —1, 5,2,1), wa 


i 
a 
R 
E 
p 
g 
e 


6. Sea V un espacio vectorial real generado por las filas de la matriz 


2 0 9 0 
7 -1 -2 -1 
4 0 6 1 
4 -1 13 0 


DON == 


(a) Hallar una base para V. 

(b) ¿Qué vectores (x1, X2, X3, Xa, X5) son elementos de V? 

(c) Si (X1, X2, X3, Xa, Xs) pertenece a V, ¿cuáles son sus coordenadas en la base ele- 
gida en la parte (a)? 
7. Sea A una matriz m x n sobre el cuerpo F y considerar el sistema de ecuaciones AX = Y. 


Demostrar que este sistema de ecuaciones tiene una solución si, y solo si, el rango de fila 
de A es igual al rango de fila de la matriz aumentada del sistema. 


3. Transformaciones lineales 


8,1, Transformaciones lineales 


Vamos a introducir ahora las transformaciones lineales, que es de lo que 
W trata en la mayor parte de lo que resta del libro. El lector encontrará de utili- 
ilad leer (o releer) el estudio sobre funciones en el Apéndice, ya que se hará 
implio uso de la terminología pertinente. 


Definición. Sean V y W. dos espacios vectoriales sobre el cuerpo F. Una 
iransformación lineal de V en W es una función T de V en W tal que 


Tlca + PB) = c(Ta) + TB 
pura todos los vectores a y B de V y todos los escalares c de F. 
Ejemplo 1. Si V es cualquier espacio vectorial, la transformación identidad 


h definida por Ja = a, es una transformación lineal de V en V. La transfor- 
mación cero 0, definida por Ox = 0, es una transformación Jineal de V en V. 


Ejemplo 2. Sea F un cuerpo y sea V el espacio vectorial de las funciones 
polinomios f de F en F, dado por 


le Í) = o + or t --- + cat 


(Wf) = c + 20r + --- + kerh, 


Intonces D es una transformación lineal de V en V: la transformación deri- 
vación. 
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Ejemplo 3. Sea A una matriz m x n dada, con elementos en el cuerpo F. 
La función T definida por T(X) = AX es una transformación lineal de FA 
en F”*!, La función U definida por U(a) = «A es una transformación lin 
de F” en F”. 


Ejemplo 4. Sea P una matriz m x m dada, con elementos en el cuerpo F, 
y sea Q otra matriz n x n dada, sobre F. Se define una función T del espacio 
F"”*" en sí mismo por 7(4) = PAQ. Entonces T es una transformación lineal 
de F"*" en F”*”, porque 


T(cA + B) = P(cA + B)Q 

(PA + PB)Q 
cPÁQ + PBQ 
cT(A) + T(B). 


Ejemplo 5. Sea R el cuerpo de los números reales y sea V el espacio 
todas las funciones continuas de R en R. Se define T por 


ana = ¿10 d 


Entonces T es una transformación lineal de V en V. La función Tf no solo es 
continua, sino que también tiene primera derivada continua. La linealidad de la 
integración es una de sus propiedades fundamentales. 
i El lector no tendrá dificultades en verificar que las transformaciones de- 
' finidas en los Ejemplos 1, 2, 3 y 5 son transformaciones lineales. La lista de 
ejemplos se ampliará considerablemente cuando se estudien más aspectos de 
las transformaciones lineales. 
Es importante observar que si T es una transformación lineal de V en W, 
entonces 7(0) = 0; lo que se ve por la misma definición, pues 
TO) = TO + 0) = T0) +70). 
Este punto es a menudo motivo de confusión para quien estudia álgebra lineal 
por primera vez, ya que probablemente haya tenido una visión un poco dife- 
rente del uso del término «función lineal». Un breve comentario al respecto 
podría aclarar esa confusión. Supóngase que V es el espacio vectorial R*. Una 
transformación lineal de V en V es entonces un tipo especial de función real 
en el eje real. En un curso de cálculo es probable que se diga que tal función 
es función lineal si su grafo es una recta. Una transformación lineal de R' en R?, 
de acuerdo con la definición, será una función de R en R cuyo grafo es una recta 
que pasa por el origen. 
A más de la propiedad 7(0) = 0 indiquemos otra propiedad general de la 
transformación lineal T. Tal transformación «preserva» las combinaciones linea- 
les; esto es, si %,, ..., 0, son vectores de V y c,, ..., C, son escalares, entonces 


Tc + -> + Cran) = (Ton) + -+ + cal Ton). 
Ello resulta directamente en forma en forma directa de la definición. Por ejemplo, 


Taa + ca) = (Ta) + T(czaz) 
cl(To) + ca Tas). 


Il 


PR —— A 
ormaciones lineales 09 


Teorema 1. Sea V un espacio vectorial de dimensión finita sobre el cuerpo 
y sea $a, .., 0.) una base ordenada de V. Sean W un espacio vectorial sobre 
el mismo cuerpo F y Bi, ..., Pa vectores cualesquiera de W. Entonces existe una 
nica transformación lineal de T de V en W tal que 


Ta, = Pi, == ori 


Demostración. Para demostrar que existe una transformación lineal T 


tal que Ta, = $; se procede como sigue. Dado a de V, existe una única n-tuple 
Mi... , x,) tal que 


a = tia + + Tran. 
Pura ese vector a se define 
Ta =08B1 + +++ + £nBr. 


Untonces, T es una correspondencia bien definida que asocia a cada vector a 
ale 1 un vector Ta de W. De la definición queda claro que Ta, = f, para cada j. 
Pura ver que T es lineal, sea 


B = ya + ` + YnOn 
de Y y sea c cualquier escalar. Ahora 
ca +B = (cx + yo + ++: + (CEn + Yn)an 
Fon lo que, por definición, 
T(ca + p) = (cu + y0B + +++ + (cta + Yn)Br- 
Por otra parte, 


c(Ta) + TB =c È Tipi + 2 Y:Bi 


= 2, (cz; + y)Bi 
y nsi 
T(ca + 6) = c(Ta) + TB. 
Si U es una transformación lineal de V en W con Uaj = Bj j= 1, ..., n, 


n 
Entonces para el vector a = 2 tia; se tiene 


i=l 


Ua = u(ž zia) 


i=1 


È z:(Ua:) 
i=l 


È Tibi 


i=l 


con lo que U es exactamente la misma correspondencia T que se definió antes, 


lo que demuestra que la transformación lineal T con Ta; = f;, es única. |] 


Gina a Y 


o 


P h t am a VIA AA tec cs T IA a 8 
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Si T es una transformación lineal de V en W, entonces la imagen de T no 
solo un subconjunto de W, sino un subespacio de W. Sea Ry la imagen de T; 
lo es, el conjunto de todos los vectores $ de W tales que $ = Ta, para algún 
n V. Sean $, y f, de Ry y sea c un escalar. Existen vectores a, y a, de Y 
Vales que Ta, = $, y Ta, = B,. Como T es lineal 


T(cor + a) = cTai + Taz 
= Cfr + Ba, 


lo que dice que cf, + ßz pertenece también a Ry. 
Otro subespacio interesante asociado con la transformación lineal T es el 


Vonjunto N, que consta de los vectores a en V tales que Ta = 0: es un subes- 
facio de V, pues 


El Teorema 1 es muy elemental, pero por su importancia ha sido presentad 
detalladamente. El concepto de función es muy general. Si Y y W son espaci 
vectoriales (no nulos), hay una multitud de funciones de Y en W. El Teorema 1 
destaca el hecho de que las funciones que son lineales son muy especiales. 


Ejemplo 6. Los vectores 
aœ = (1,2) 


a = (3,4) 
son linealmente independientes y, por tanto, forman una base de R?. De acuer: 
do con el Teorema 1, existe una única transformación lineal de R? en R? tal qu 
Tor = (3, 2, 1) 
Ta: = (6, 5, 4) 


De ser así, se debe poder encontrar 7(€,). Encontrados los escalares c,, cz tali 
que €, = ca, + C202, se sabe entonces que Te, = c,Ta, + c,Ta,. Si (1, 0) = 


fa) T(0) = 0, con lo que N no es vacío. 
tb) Si Ta, = Ta, = 0, entonces 


T(cor + 02) = Ta + Tas 


c(l, 2) + c2(3, 4), entonces c, = —2 y c, = 1. Con lo que Z 
T(1,0) = —2(3, 2, 1) + (6, 5, 4) ven lo que ca, + a, pertenece a N. 
= (0, 1, 2). 


Definición. Sean V y W dos espacios vectoriales sobre el cuerpo F y sea T 
Mw transformación lineal de V en W. El espacio nulo de T es el conjunto de todos 
las vectores œ de V tales que Ta = 0. 

Si V es de dimensión finita, el rango de T es la dimensión de la imagen de T y 
hi nulidad de T es la dimensión del espacio nulo de T. 


Ejemplo 7. Sea T una transformación lineal del espacio de los m-tupl 
F” en el espacio de los n-tuples F". El Teorema 1 dice que T está univocamen 
determinado por la sucesión de vectores fB,, ..., Bm donde 

Bi = Tes, A A 
Dicho brevemente, T está univocamente determinado por las imágenes de 1 


He aquí uno de los resultados más importantes del álgebra lineal. 
vectores de la base canónica. Esta determinación es 


a = (Ty. » -s m) 


Ta = tpi + -** + Emm- 


Si B es la matriz m x n que tiene por filas los vectores f, . . -, Pm» esto quie 
decir que 


Teorema 2. Sean V y W espacios vectoriales sobre el cuerpo F y sea T una 
transformación lineal de V en W. Supóngase que V es de dimensión finita. Entonces 


rango (T) + nulidad (T) = dim V. 


Demostración. Sea (0%, ..., ay} una base de N, el espacio nulo de T. Exis- 


Ta = aB. e Vectores Okt 1s - - - , On EN V tales que {a;, . . . , 0) es una base de V. Podemos 
Op lemostrar ahora que (Toy+1, - - -, Tony es una base para la imagen de T. Los 
O sea que si f; = (Bia, -- -> Bin), entonces vectores Ta, .. ., To, generan evidentemente la imagen de 7, 'y como Ta, = 0 
Bu ... Bin pura j < k, se ve que To+1, ..., To, generan la imagen. Para ver que estos 
Tí, -o <, En) = [1 <- Za] |: : . vectores son linealmente independientes, supóngase que se tienen escalares 
Ba”. Ba «, tales que 


Esta es una descripción muy explícita de la transformación lineal. En la Sec: 
ción 3.4 se hará un estudio detallado de la relación entre las transformacion: 
lineales y las matrices. No se “seguirá con la descripción particular Ta = qB, 
porque tiene la matriz B a la derecha del vector a y ello puede inducir a confu 
sión. La razón de este ejemplo es hacer ver que se puede dar una descripció 
explícita y razonablemente simple de todas las transformaciones lineales d 
Echa F. 


È (Ta) =0. 
1=k41 


Esto dice que 
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y en consecuencia, el vector a = E, 00 pertenece al espacio nulo de T. 
iS 
Como dy, ..., % forman una base de N, deben existir escalares b4, ..., 
tales que 
k 
a= Y biai. 
i=l 
Con lo que 
k n 
2 bai— È ca=0 
i=l j=k+1 
y COMO Ay,-..., 0%, son linealmente independientes, se debe tener 


b=--=bh=04=>-=064=0 


Si el rango de T es r, el hecho de que Tax +1, ..., Ta, formen una base d 
la imagen de T nos dice que r = n — k. Como k es la nulidad de T y n es la di: 
mensión de V, se tiene lo afirmado. B 


Teorema 3. Si A es una matriz m x n de elementos en el cuerpo F. entonces 


rango de filas (A) = rango de columnas (A) 


Demostración. Sea T una transformación lineal de F"”** en F”*! definid 
por T(X) = AX. El espacio nulo de T es el espacio de soluciones del sistema 
AX = 0, es decir, el conjunto de todas las matrices columna Y tales que AX = 0. 
La imagen de T es el conjunto de todas las matrices columna m x 1, Y, tal 
que AX = Y tiene una solución para X. Si A,,..., A, son las columnas de A, 
entonces 


AX =x41+ +: +2%,An 


de modo que la imagen de T es el subespacio generado por las columnas de A. 
Es decir, que la imagen de T es el espacio de las columnas de A. Por tanto, 


rango (7) = rango de columnas (4). 


El Teorema 2 dice que si S es el espacio de soluciones del sistema AX = 0, en- 
tonces 


dim S + rango de columnas (4) = n. 

Sea ahora el Ejemplo 15 del Capítulo 2. Ahí se vio que, si r es la dimensión 
del espacio de filas de A, entonces el espacio de soluciones S tiene una base 
que consta de n — r vectores: 

dim S = n — rango de filas (4). 
En consecuencia 
rango de filas (4) = rango de columnas (4). Ẹ 


La demostración del Teorema 3 que acaba de darse depende de cálculos 
explícitos con sistemas de ecuaciones lineales. Hay una demostración más 
conceptual que no se basa en tales cálculos. Se dará tal demostración en la 
Sección 3.7. 


Ejercicios 


l ¿Cuáles de las siguientes funciones T de R? en R? son transformaciones lineales? 


(a) Ta, 22) = (1 + zy 22); 

(b) T(a, 22) = (22, 21); 

(c) Thau T2) = (2%, 22); 

(d) T(t 22) = (senza, 29); 

(0) T(a, 2) = (21 — Ta 0). 
È Hallar la imagen, rango, espacio nulo y nulidad para la transformación cero y la trans- 
formación identidad en un espacio de dimensión finita V. 


A Describir la imagen y el espacio nulo para la transformación derivación del Ejem- 
plo 2. Hacer lo mismo para la transformación: integración del Ejemplo 5. 


4. ¿Existe una transformación lineal T de R? en R? tal que 7(1l, —1, 1) = (1, 0) y 


Mi. 1. 1) =(0, 1)? 


S Si 
a=(1,-D, = (1,0) 
aœ: = (2, —1), = (0,1) 
as = (—3, 2), B= (1,1) 


elyiste una transformación lineal T de R? en R? tal que To, = f, para i = 1, 2, 3? 


® Describir explícitamente (como en los Ejercicios 1 y 2) la transformación lineal 7 de 
I en F? tal que Te, = (a, b), Te, = (c, d). 


%. Sca F un subcuerpo de los números complejos y sea T una función de F? en F’ de- 
fimda por 


T(E, La, 23) = (T1 — Za + 223, 201 + T2, — T1 — 22 + 223). 


(1) Comprobar que T es una transformación lineal. 

(b) Si (a, b, c) es un vector de F?, ¿cuáles son las condiciones para a, b y c de modo que 
W| vector pertenezca a la imagen de T? ¿Cuál es el rango de T? 

te) ¿Cuáles son las condiciones para a, b y c de modo que (a, b, c) pertenezca al espe- 
vio nulo de 7? ¿Cuál es la nulidad de 7? 


N Describir explícitamente una transformación lineal de R? en R? que tiene como ima- 
en el subespacio generado por (1, 0, —1) y (1, 2, 2). 
%, Sea V el espacio vectorial de todas las matrices n x n sobre el cuerpo F y sea B una ma- 
iiz n x n dada. Si 

T(A) = AB — BA 
vumprobar que T es una transformación lineal de V en V. 


10, Sca V el conjunto de todos los números complejos considerado como un espacio 
vectorial sobre el cuerpo de los números reales (con las operaciones usuales). Hallar una 
función de V en V que sea una transformación lineal en dicho espacio vectorial, pero que 
ho sea una transformación lineal en C*; es decir, que no sea lineal compleja. 


MM, Sea V el espacio de las matrices n x 1 sobre Fy sea W el espacio de las matrices m x 1 
sobre F. Sea A una matriz m x n dada y sea T la transformación lineal de V en W, definida 


} b. Mo aye A 
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por T(X) = AX. Demostrar que T es la transformación cero si, y solo si, A es la matriz 


Para comprobar que el conjunto de transformaciones lineales de Y en W 
cero. j 


nto con cstas operaciones) es un espacio vectorial, se debe verificar directa- 
nte cada una de las condiciones para la adición vectorial y la multiplica- 
n por escalar. Se dejan los detalles de esto al lector, bastando aquí los si- 
inentes comentarios: El vector cero en este espacio será la transformación 
ula, que transforma cada vector de V en el vector cero de W; cada una de las 
propiedades de las dos operaciones es consecuencia de la correspondiente 
piedad de las operaciones en el espacio W. P 


12. Sea V un espacio vectorial V de dimensión n sobre el cuerpo F y sea T una transfo; 
ción lineal de V en V tal que la imagen y el espacio nulo de T sean idénticos. Demo 
que n es par. (¿Se puede dar un ejemplo de tal transformación lineal 7?) 


13. Sea V un espacio vectorial y T una transformación lineal de V en V. Demostrar que 
las dos afirmaciones siguientes sobre T son equivalentes. 

(a) La intersección de la imagen de T y el espacio nulo de T es el subespacio cero de V. 

(b) Si T(Ta) = 0, entonces Ta = 0. 
Es conveniente mencionar otro modo de ver este teorema. Si se definen 
suma y la multiplicación por escalar como se hizo antes, entonces el conjunto 
todas las funciones de V en W es un espacio vectorial sobre el cuerpo F. Esto 
tiene nada que ver con que Y sea un espacio vectorial, solo necesita que V 
a un conjunto no vacío. Cuando V es un espacio vectorial, se puede definir 
nm transformación lineal de V en W, y el Teorema 4 dice que las transformacio- 
nos lineales forman un subespacio del espacio de todas las funciones de V en W. 
se representará el espacio de las transformaciones lineales de V en W por 
', W). Se recuerda al lector que L(V, W) se define solo cuando V y W son 
pacios vectoriales sobre el mismo cuerpo. 


3.2. Algebra de las transformaciones lineales 


En el estudio de las transformaciones lineales de V en W es de fundamen: 
tal importancia que el conjunto de estas transformaciones hereda una estru 
tura natural de espacio vectorial. El conjunto de las transformaciones lineales 
de un espacio V en sí mismo tiene incluso una estructura algebraica mayor, 
pues la composición ordinaria de funciones da una «multiplicación» de tales 
transformaciones. Se analizarán estas ideas en esta sección. 


Teorema 5. Sea V un subespacio vectorial de dimensión finita n sobre el 
rpo F, v sea W un espacio vectorial de dimensión finita m sobre F. Entonces 
espacio L(V, W) es de dimensión finita y tiene dimensión mn. 


Teorema 4. Sean V y W espacios vectoriales sobre el cuerpo F. Sean T 
U transformaciones lineales de V en W. La función (T + U) definida por 


(T + UlNa) = Ta + Ua 


es una transformación lineal de V en W. Si c es cualquier elemento de F, la función 
(cT) definida por 


Demostración. Sean 


G = {a...an} yY @ = {bn o, Bm) 


"es ordenadas de V y W, respectivamente. Para cada par de enteros (p, q) 
ni<p<myl<qąx<n se define una transformación lineal E”* de V 


(cT)&) = c(Ta) 
es una transformación lineal de V en W. El conjunto de todas las transformacione: 


lineales de V en W, junto con la adición y la multiplicación escalar aquí definidas, Wn W por 
es un espacio vectorial sobre el cuerpo F. Aoa (o si 1%q 
Demostración. Supóngase que T y U son transformaciones lineales de i » si i=q 
V en W, que se define (T + U) como se indicó. Entonces = 58 
—= 0iqPp- 
(T + U)íca + 8) = T(ca + 8) + Ulca + B) i : m TN 
= c(Ta) + TB + c(Ua) + UB Vw acuerdo con el Teorema 1, existe una transformación lineal única de V en 
= «(Ta + Ua) + (T8 + UB) W que satisface estas condiciones. Se afirma que las mn transformaciones £” 43 
= e(T + U)Na) + (T + UNS) forman una base de L(V, We s ¿ 
Sea T una transformación lineal de V en W. Para cada j, 1 < j < n, sean 
que dice que (T + U) es una transformación lineal. En forma análoga, Mir +. - > Am; las coordenadas del vector Ta, en la base ordenada @’, es decir, 


(cT)(da + 8) = c[T (de + $)] (0 
c[d(Ta) + TB] b 

c(Ta) + c(T] 

= d[c(Ta)] e EA W)ueremos demostrar que 
= d[(cT)a] + (cT)6 o 208% wi 


que dice que (cT) es una transformación lineal. p=1 q=1 


Ta = Y A ib y. 
p=1 


o 


76 http/libreria-universitaria.blogspot.com Algebra 


Sea U la transformación lineal del segundo miembro de (3-2). Entonces pa 
cada j 


Ua; = E E Ap E”-(aj) 
P a 
= E 2 A pbiob 
pq 


3 AsiBp 


p=1 
= Taj 
y en consecuencia U = T. Pero como (3-2) dice que los E”-* generan L(V, 


debemos demostrar que son independientes. Pero esto queda claro con lo ex: 
puesto anteriormente; en efecto, si la transformación 


U.=3 AE” 
pP 4 
es la transformación nula, entonces Ua; = 0 para cada j, con lo qùe 
z AsiBp =0 
pl 
y la independencia de los £, implica que A,;= 0 para todo p y j. T 


Teorema 6. Sean V, W y Z espacios vectoriales sobre el cuerpo F. Sea T i 
transformación lineal de V en W y U una transformación lineal de W en Z. Enton: 
ces la función compuesta UT definida por UT(a) = U(T(a)) es una transforma: 
ción lineal de V en Z. 


Demostración. 


(UT) (ca + 8) = U[T(ca + B)] 

U(cTa + TB) 

= c[U(Ta)] + U(TE) 

= «(UT)(a) + (UTIB). Y 


En lo que sigue debemos interesarnos principalmente en transformaciones 
lineales de un espacio vectorial en sí mismo. Como se tendrá a menudo que 
escribir «T es una transformación lineal de V en V», se dirá más bien: «T es 
un operador lineal sobre V». 


Definición. Si V es un espacio vectorial sobre el cuerpo F, un operador lineal 
sobre V es una transformación lineal de V en V. 


En el caso del Teorema 6, cuando V = W = Z, en que U y T son opera- 
dores lineales en el espacio V, se ve que la composición UT es también un ope- 
rador lineal sobre V. Así, el espacio L(V, V) tiene una «multiplicación» de- 
finida por composición. En este caso el operador TU también está definido, 
y debe observarse que en general UT + TU, es decir, UT — TU + 0. Se ha 
de advertir de manera especial que si T es un operador lineal sobre V, entonces 


puede componer 7' con T. Se usará para ello la notación 7? = TT, y en ge- 
17% = T---T (n veces) para n= 1, 2,3, ... Se define T? = / si T £ 0. 


Lema. Sea V un espacio vectorial sobre el cuerpo F; sean U, T, y T, opera- 
res lineales sobre V; sea c un elemento de F. 

(a) JU = Ul = U,; 

(b) U(T, + T,) = UT, + UT,; (T, + T¿JU = T,U + T,U; 

(c) c(UT,) = (cU)T, = U(cT,). 


Demostración. (a) Esta propiedad de la función identidad es obvia. Se 
ħa enunciado aquí solo para insistir. 


(b) [U(T, + T2)1(c) = UL(T, + T2)(0)] 

= U(T ia + T:a) 

= U(Tia) + U(T:0) 

= (UTY(a) + (UT)(a) 
UIT, + T,) = UT, + UT,. También 
LT: + ToJUl(a) = (Ti + Ta) (Ua) 
T¡(Ua) + T:(Ua) 

= (T,0)(a) + (7+U)(a) 

lo que (T, + T,JU = T,U + T,U. (El lector observará que las demos- 
iones de estas dos leyes distributivas no han tenido en cuenta que T, y 
wran lineales, y la demostración de la segunda tampoco considera el que U es 
al.) 
(c) Se deja al lector la demostración de la parte (c). J 


1 


El contenido de este lema, y una parte del Teorema 5, dicen que el espacio 
torial L(V, V), junto con la operación de composición, es lo que se conoce 
mo un álgebra lineal con identidad. Se examinará esto en el Capítulo 4. 


Ejemplo 8. Si A es una matriz m x n con elementos en F, se tiene la trans- 
mación lineal T definida por T(X) = AX de F”*! en F”*!. Si B es una matriz 
x m, se tiene la transformación lineal U de F"** en F?*! definida por 
Y) = BY. La composición UT se define fácilmente por: 
(UTX(X) = U(T(X)) 

U(AX) 

= B(AX) 

= (BAJX. 
si UT es «multiplicación a la izquierda por el producto de matrices BA». 


Ejemplo 9. Sea F un cuerpo y V el espacio vectorial de todas las funciones 
linomios de F en F. Sea D el operador de derivación definido en el Ejemplo 2, 
sa T el operador lineal «multiplicación por x»: 


(TN) = 2f(2). 
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Entonces DT + TD. En efecto, el lector no tendrá dificultad en verificar que 
DT — TD = 1, el operador identidad. 

Aun cuando la «multiplicación» que se tiene en L(V, V) no es conmutativa, 
está muy relacionada con las operaciones en el espacio vectorial L(V, V). 


Ejemplo 10. Sea @ = (a, ..., On} una base ordenada de un espacio 
vectorial V. Se consideran los operadores lineales E”? que se presentaren en 
la demostración del Teorema 5: 


Er(a;) = digOp. 


Estos n? operadores lineales forman una base del espacio de los operadores 
lineales sobre V. ¿Qué es E”%E""*? Se tiene 
(E>-Er (05) = EP: (òis) 
= 0, Er-(a,) 
= ið Ap. 
Luego 
0, si rX*gq 


PA Er, si q=r. 


Sea T un operador lineal sobre V. Se probó en la demostración del Teore- 
ma 5 que si 


4; = [Taza 
A = [An..., An] 
entonces 
T = E XApLE”. 
P 4 
Si 


U = 32 B.E"" 
ra 


es otro operador lineal en V, entonces el lema anterior dice que 
TU = 22 A nE”) (X E Ba E) 
Pa ra 
= 21332 A2BE"“E"". 
pora 


Como observamos, los únicos términos que quedan en esta considerable suma 
son los términos con q = r, y como EPE" = EP-", se tiene 


TU = È Z (2 4»B.)E”* 
pal r 
= È Z (A4B)p Er". 
po 


Así el efecto de componer T y U es el de multiplicar las matrices A y B. 

En el tratamiento de las operaciones algebraicas con transformaciones 
lineales no se ha dicho nada aún sobre inversión. Una pregunta concreta de 
interés es la siguiente. ¿Para cuáles operadores lineales T' en el espacio V existe 
un operador lineal T~’ tal que 777! = T'T =M 


Una función T de V en W se dice inversible si existe una función U de W en 
V tal que UT es la función identidad de V y TU es la función identidad de W. 
$i T' es inversible, la función U es única y se representa por T”*. (Véase Apén- 
dice.) Más aún, T es inversible si y, solo si, 


I. T es inyectiva, esto es, Ta = Tf implica a = P. 
2. T es sobreyectiva, esto es, la imagen de T es (coincide con) W. 


Teorema 7. Sean V y W dos espacios vectoriales sobre el cuerpo F y sea 
F una transformación lineal de V:en W. Si T es inversible, entonces la función 
reciproca T7* es una transformación lineal de W sobre V. 


Demostración. Volvemos a repetir para aclarar un aspecto. Cuando T es 
una función inyectiva y sobreyectiva, existe una única función recíproca TAE 
que aplica W sobre V, de modo que 77 *T sea la función identidad de V, y TIRA 
sen la función identidad de W. Lo que se ha de demostrar aquí es que si una 
lunción lineal T es inversible, entonces la recíproca T”* también es lineal. 

Sean £, y Bz dos vectores de W y sea c un escalar. Queremos demostrar que 


T- (cb + Pa) = CT "Br + T'e. 
Sea a, = T7*B,, i = 1, 2; esto es, sea a, el único vector de V, tal que Ta, = fi. 
Como T es lineal, 
T(car + a) = Ta, + Tos 
= cB1 + Pa. 
Asi, ca, + a, es el único vector de V que es aplicado por T en cf, + ba» y así 


TXAcB1 + b2) = car + az 
AT81) + Tp: 


y T”* es lineal. Ẹ 


Supóngase que se tiene una transformación lineal inversible T de Y sobre 
W y una transformación lineal inversible U de W sobre Z. Entonces UT es 
inversible y (UT) * = T7*U7*. Esta conclusión no exige la linealidad, ni 
tampoco implica comprobar separadamente que UT es inyectiva y sobreyectiva. 
Todo lo que se necesita es comprobar que T~ *U 71 es inversa a la izquierda 
e inversa a la derecha de UT. 

Si T es lineal, entonces Tía — $) = Ta — TB; luego Ta = TB si y, solo si, 
Tix — $) = 0. Esto simplifica mucho la comprobación de que T es inyectiva. 
Se dice que la transformación lineal T es no singular si Ty = 0 implica y = 0; 
es decir, si el espacio nulo de 7 es {0}. Evidentemente, T es inyectiva si y, solo 
si, T es no singular. El alcance de esta observación es que las transformaciones 
lineales no singulares son las que preservan la independencia lineal. 


Teorema 8. Sea T una transformación lineal de V en W. Entonces T es no 
singular si, y solo si, T aplica cada subconjunto linealmente independiente de V 
sobre un subconjunto linealmente independiente de W. 


A A isso. $ 


SEA Y 
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Demostración. Supóngase primero que T es no singular. Sea S un sub- 
conjunto linealmente independiente de V. Si a,, ..., a, son vectores pertene- 
cientes a S, entonces los vectores Ta,, ..., Ta, son linealmente independien- 
tes; en efecto, si 


al Ta) Hs: EE cil Tax) =0 
entonces 
T(ca + --- + cia) = 0 


y como T es no singular 
aa + +: + ooa = 


de lo que se sigue con que cada c, = 0, pues S es un conjunto independiente. 
Este razonamiento muestra que la imagen de S por T es independiente. 

Supóngase que T aplica subconjuntos independientes sobre subconjuntos 
independientes. Sea œ un vector no nulo de V. Entonces el conjunto S que consta 
del solo vector a es independiente. La imagen de S es el conjunto que consta 
del solo vector Tu. Por tanto, Ta + 0, pues el conjunto que consta del 'solo 
vector nulo es dependiente; lo que muestra que el espacio nulo de 7 es el sub- 
espacio cero, es decir, T es no singular. 


Ejemplo 11. Sea F un subcuerpo de los números complejos (o un cuerpo de 
característica cero) y sea V el espacio de las funciones polinomios sobre F. Consi- 
dérese el operador derivación D y el operador de la «multiplicación por x», T, 
del Ejemplo 9. Como D aplica todas las constantes sobre 0, D es singular; sin 
embargo, V no es de dimensión finita, la imagen de D es todo V y es posible 
definir una inversa a la derecha de D. Por ejemplo, si E es el operador integra- 
ción indefinida: 


crar+l 


Elco + ar + +: + cnt”) = 00 + a+ SES +. 
entonces E es un operador lineal en V y DE = I. Por otro lado, ED + 1, pues 
ED aplica las constantes sobre 0. El operador T está, por así decirlo, en la si- 
tuación contraria. Si xf(x) = 0 para todo x, entonces f = 0. Con lo que T es 
no singular y es posible hallar una inversa a la izquierda de T. Por ejemplo, 
si U es la operación «suprimir el término constante y dividir por x»: 


Ulco + ar + ==> + cat?) = 01 + e H +++ par! 
entonces U es un operador lineal en V y UT = 1. Pero TU 4 l, ya que cada 
función en la imagen de TU está en la imagen de T, que es el espacio de las fun- 
ciones polinomios f tales que f(0) = 0. 


Ejemplo 12. Sea F un Cuerpo y sea T el operador lineal sobre F? definido por 
T(21, 22) = (t1 + Ta, 21). 


Untonces Tes no singular, pues si T(x,, x,) = 0 se tiene 


a+%m=0 
a=0 


von lo que x; = x, = 0. También se ve que T es sobreyectiva, pues si (z,, Z2) 
tualquier vector de F?, para ver que (z,, Z2) pertenece a la imagen de T se 
han de encontrar escalares x, y x, tales que 


Tı t t= 
Ti = 2 


lu solución obvia es x, = zz, Xx, = Zı — Z2. Este último cálculo da una fórmu- 
explícita para T~ !, a saber, 


TA2r, 22) = (22, %1 — 22). 


Se ha visto en el Ejemplo 11 que una transformación lineal puede ser no 
singular sin ser sobreyectiva y que puede ser sobreyectiva sin ser no singular. 
1 presente ejemplo ilustra un importante caso en que ello no puede suceder. 


Teorema 9. Sean V y W espacios vectoriales: de dimensión finita sobre el 
Vuerpo F tal que dim V = dim W. Si T es una transformación lineal de V en W, 
hw siguientes afirmaciones son equivalentes: 


(i) T es inversible. 
(ii) T es no singular. 
(iii) T es sobreyectiva; eso es, la imagen de T es W. 


Demostración. Sea n = dim V = dim W. Por el Teorema 2 se sabe que 
rango de (T) + nulidad (T) = n. 


¡Ahora bien, T es no singular si, y solo si, nulidad (7) = 0, y (como n = dim w) 
ln imagen de T es W si, y solo si, rango (T) = n. Como el rango más la nulidad 
W n, la nulidad es O precisamente cuando el rango es n. Por tanto, T es no sin- 
¡pular si, y solo si, T(V) = W. Así, si rigen las condiciones (ii) o (iii), la otra se 
vumple también y T es inversible. | 


Se previene al lector que no debe aplicar el Teorema 9, excepto si la dimen- 
alón es finita y con dim V = dim W. Con las hipótesis del Teorema 9 las con- 
diciones (i), (ii) y (iii) son también equivalentes a éstas. 


(iv) Si fa, ..., a, ) es una base de V, entonces (Ta, ...., Ta,) es una base 
de W. 

(v) Existe una base [a,, ..., any de V tal que {Ta;, ..., Tan} es una base 
de W. 


Se dará una demostración de la equivalencia de las cinco condiciones que 
ls diferente a la dada para la equivalencia de (i), (ii) y (iii). 

(i) > (ii).. Si T es inversible, T es no singular. (ii) —> (iii). Supóngase que 
T es no singular. Sea [a;, . . ., a) una base de V. Por el Teorema 8, (Tay, ..., 
Tx, | es un conjunto linealmente independiente de vectores de W, y como la 
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l conjunto de los vectores en un espacio vectorial, junto con la operación de 
ión vectorial, es un grupo conmutativo. Un cuerpo puede ser descrito como 
conjunto con dos operaciones, llamadas adición y multiplicación, que es 
grupo conmutativo para la adición, y en que los elementos no nulos forman 
grupo conmutativo para la multiplicación, teniéndose, además, la ley dis- 
butiva x(y + z) = xp + xz. 


dimensión de W es también n, este conjunto de vectores es una base de W. Aho 
sea $ cualquier vector de W. Existen escalares c,, ..., €, tales que 


B = alToa) + --- + ca(Taa) 
= Taa + --* + cnan) 


lo que muestra que $ pertenece a la imagen de T. (iii) — (iv). Se supone aho; 
que T es sobreyectiva. Si (x,, ..., a,) es cualquier base de V, los vecto: 
Tai, . . . , To, generan la imagen de T, que es W por definición. Como la dimen- 
sión de W es n, estos n vectores deben ser linealmente independientes, esto 
deben constituir una base de W. (iv) — (v). Esto no requiere comentarios. 
(v) > (i). Supóngase que existe alguna base (0,, ..., a,) de V tal que (01, ..., 
Tan} es una base de W. Como los Ta; generan W, está claro que la imagen di 
T es todo W. Sia = c,0, + *** + C,0, pertenece al espacio nulo de T, entonces 


Tícior + -+ + cnan) = 0 


Mjercicios 
E Scan T y U operaciones lineales en R? definidas por 
T(2, 2) = (221) y ` U(t, T) = (21, 0). 


ta) ¿Cómo se describirán T y U geométricamente? 
(b) Dar reglas semejantes a las que definieron T y U para cada una de las transforma- 
lbnes (U + T), UT, TU, T?, U?. 


elf + -++ + ca(Tan) = 9 $ Sea T el (único) operador lineal sobre C? para el que 
y como los Ta; son independientes, cada c; = 0, y así a = 0. Se ha visto que el 
recorrido de T es W, y que T es no singular, luego T es inversible. 

El conjunto de operadores lineales inversibles sobre un espacio Y con la 
operación de composición proporciona un buen ejemplo de lo que se conoce 
en álgebra como «grupo». Aunque no se tendrá tiempo para examinar los gru- 
pos con algún detalle, se dará al menos la definición. 


Te, = (1,0,2), Te = (0,1, 1), Te = (i, 1, 0). 
l inversible? 
Sca 7 el operador lineal sobre R? definido por 
T(%1, Ta, 23) = (371, Ti — Lo, 2% + T2 + 23). 
Ns T inversible? De serlo, hallar una expresión para T~! como aquella que define a T. 
Definición. Un grupo consta de lo siguiente. W Para el operador lineal T del Ejercicio 3, demostrar que 
(7?— I)(T — 3I) = 0. 
E Sea C?*2 el espacio vectoriál complejo de las matrices 2 x 2 de elementos comple- 


P Sea 
1.51 
cl ca y 


y wa 7 el operador lineal sobre C?*? definido por 7(4) = BA. ¿Cuál es el rango de T? 
¡Je puede describir 7?? 


A Sca T una transformación lineal de R? en R? y sea U una transformación lineal de 
R’ en R?. Demostrar que la transformación UT no es inversible. Generalizar el teorema. 


1. Un conjunto G; 

2. Una correspondencia (u operación) que asocia a cada par de elementos 
x, y de G, un elemento xy de G de tal modo que 

(a) x(»z) = (xy)z para todo x, y, z en G (asociatividad); 

(b) existe un elemento e en G tal que ex = xe = x para todo x de G; 

(c) a cada elemento x de G le corresponde un elemento x7* en G tal que 


AS a = e, 


Se ha visto que la composición (U, T)— UT asocia a cada par de opera- 
dores lineales inversibles sobre un espacio V otro operador inversible sobre V. 
La composición es una operación asociativa. El operador identidad 7 satis- 
face IT = TI = T para todo T, y para un T inversible existe (por el Teorema 7) 
un operador lineal inversible 77* tal que 7TT7* = T7*T = I. Con lo que el 
conjunto de los operadores lineales inversibles sobre V, junto con esta opera- 
ción, es un grupo. El conjunto de las matrices n x n inversibles, con la multi- 
plicación matricial como operación, es otro ejemplo de grupo. Un grupo se 
dice conmutativo si satisface la condición" xy = yx para cada x e y. Los dos 
ejemplos dados anteriormente no son, en general, grupos conmutativos. A me- 
nudo se escribe la operación en un grupo conmutativo como (x, y) =>x + y, 
en vez de (x, y) — xp, usándose entonces el símbolo 0 para el elemento «neutro» e. 


T Encontrar dos operadores lineales T y U en R? tales que TU =0, pero que UT # 0. 


W Scan V un espacio vectorial sobre el cuerpo F y T un operador lineal sobre V. Si 
F" 0, ¿qué se puede decir respecto a la relación entre la imagen de T y el espacio nulo 
le 1? Dar un ejemplo de un operador lineal T en R? tal que T? = 0, pero T + 0. 


D, Sca T un operador lineal sobre el espacio V de dimensión finita. Supóngase que existe 
mn operador lincal U en V tal que TU = 1. Demostrar que T es inversible y que U = T”!. 
Dar un ejemplo que muestre que esto es falso cuando V no es de dimensión finita. (Indicación: 
un F= D el operador derivación en el espacio de las funciones polinomios.) 


10, Sea A una matriz m x n con elementos en F y sea T la transformación lineal de F"*! 


mn A. A — A Po n es 


— ii .. AP  — AAA 
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Haremos algunos breves comentarios. Supóngase que T es un isomorfismo 
V sobre W. Si S es un subconjunto de V, entonces el Teorema 8 dice que 
vs lincalmente independiente si, y solo si, el conjunto T(S) en W es indepen- 
mte. Así, para decidir si S es independiente no importa si se considera S O 
Ni, Por lo que se ve que un isomorfismo «preserva la dimensión», esto es, 
la subespacio de dimensión finita de V tiene la misma dimensión que su 
agen por T. He aquí una sencilla ilustración de esta idea. Supóngase que 
Y a matriz m x n sobre el cuerpo F. Ya se han dado en realidad dos de- 
¡ciones del espacio solución de la matriz A. La primera es el conjunto de 
los los n-tuples (x4, ..., X,) de F” que satisfacen a cada una de las ecua- 
mes del sistema AX = 0. La segunda es el conjunto de todas las matrices 
humnas n x 1, X, tales que AX = 0. El primer espacio solución es así un 
hespacio F” y el segundo es un subespacio del espacio de todas las matrices 
* | sobre F. Ahora bien, existe un isomorfismo completamente obvio entre 
y F"*!, a saber, 


en F"*! definida por T(X) = AX. Hacer ver que, si m < n, puede suceder que T sea 
breyectiva sin ser no singular. En forma semejante hacer ver que si m > n puede toma 
T no singular, pero no sobreyectiva. 


11. Sea V un espacio vectorial de dimensión finita y sea T un operador lineal sobre 
Supóngase que el rango (T+) = rango (T). Demostrar que la imagen y el espacio nulo 
T son disjuntos, es decir, tienen solo el vector nulo en común. 


12. Sean p. m y n enteros positivos y F un cuerpo. Sean V el espacio de las matrices m x 
sobre F y W el espacio de las matrices p x n sobre F. Sea B una matriz p x m dada y 
T la transformación lineal de V en W definida por 7(4) = BA. Demostrar que T es in: 
sible si, y solo si, p = m y B es una matriz m x m inversible. 


3.3. Isomorfismo 


Si V y W son espacios vectoriales sobre el cuerpo F, toda transformaci 
lineal 7T de V en W sobreyectiva e inyectiva, se dice isomorfismo de V sobre 
Si existe un isomorfismo de V sobre W, se dice que V es isomorfo a W. 

Obsérvese que V es trivialmente isomorfo a V, ya que el operador identi 
es un isomorfismo de V sobre V. También si V es isomorfo a W por un isom: 
fismo T, entonces W es isomorfo a V, pues T”* es un isomorfismo de W sob) 
V. El lector podrá demostrar fácilmente que si V es isomorfo a W y W es i 
morfo a Z, entonces V es isomorfo a Z. En resumen, el isomorfismo es u 
relación de equivalencia sobre la clase de espacios vectoriales. Si existe un is 
morfismo de V sobre W, se dirá a veces que V y W son isomorfos, en vez 
que V es isomorfo a W. Ello no será motivo de confusión porque V es isomorl 
a W, si, y solo si, W es isomorfo a V. rcicios 


Tı 
(Lp >. -) Tn) > 
E 


Por este isomorfismo, el primer espacio solución de A es aplicado sobre el 
undo espacio solución. Estos espacios tienen la misma dimensión, y así, 
he quiere demostrar un teorema respecto a la dimensión del espacio solución, 
importa qué espacio se elija para analizar. En realidad, el lector no se sor- 
mderá si decidimos identificar F” con el espacio de las matrices n x 1. Esto 
hará cuando sea conveniente, y cuando no sea conveniente no se hará. 


Sen V el conjunto de los números complejos y sea F el cuerpo de los números reales. 
las operaciones usuales V es un espacio vectorial sobre F. Describir explícitamente 
k isomorfismo de este espacio sobre R?. 


Teorema 10. Todo espacio vectorial de dimensión n sobre el cuerpo F 
isomorfo al espacio F". 


Demostración. Sea V un espacio vectorial de dimensión 7 sobre el cu 
po Fy sea @ = (x,,...,a,) una base ordenada para V. Se define una función 
de V en F", como siguè: Si a pertenece a V, sea Ta el n-tuple (X4, ..., Xp) 
coordenadas de a respecto de la base ordenada GB, es decir, el n-tuple tal q 


Sea V un espacio vectorial sobre el cuerpo de los números complejos y supóngase que 
iste un isomorfismo T de V sobre C?. Sean a,, 0%, 03, %4 vectores en V tales que 
Tor = (1,0, 1), Ta: = (-2, 1 + 1,0), 
Ta = (—1,1,1), Tos = (V2, ù, 3). 
la) ¿Está a, en el subespacio generado por a, y az? 
(b) Sca W, el subespacio generado por a, y x, y sea W, el subespacio generado por ay, 
Ma. ¿Cuál es la intersección de W, y W2? 
(œ) Hallar una base del subespacio de Y generado por los cuatro vectores o;. 


a = tom + --- + Tran. 


En nuestro estudio sobre coordenadas en el Capítulo 2, se verificó que T 
lineal inyectiva y aplica V sobre F". Į 

A Sex W el conjunto de todas las matrices hermíticas 2 x 2, esto es, el conjunto de las matri- 
pes complejas 2 x 2, A, tales que A¡¿= A ¡¡ (la barra indica conjugación compleja). Como se 
señalaba en el Ejemplo 6 del Capítulo 2, W es un espacio vectorial sobre el cuerpo de los 
iumeros reales con las operaciones usuales. Verificar que 


920 i o 


y—iz toa 


Para muchos fines es frecuente considerar los espacios vectoriales isomo: 
fos como si fueran «el mismo», aunque los vectores y las operaciones en l 
espacios sean muy diferentes: es decir, a menudo se identifican espacios i: 
morfos. No pretendemos prolongar ahora la discusión de esta idea, sino q 
la asimilación de la comprensión del isomorfismo y del sentido en que los 
pacios isomorfos son «los mismos» se irá haciendo a medida que se contin 
el estudio de espacios vectoriales. 


ws un isomorfismo de R* sobre W. 
4, Demostrar que F”*" es isomorfo a F”. 


A 


u A A AS A a. ci 


—Q>—_——_— AB EAS e he 


AA Es 
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5. Sea V el conjunto de los números complejos considerados como espacio vectorial sobi 
el cuerpo de los números reales (Ejercicio 1). Se define como sigue una función T de V 
el espacio de las matrices reales 2 x 2. Si z = x + iy, con x e y números reales, ento: 


(a) Verificar que T es una transformación lineal (real) inyectiva de V en el espacio 
las matrices reales 2 x 2. 

(b) Verificar que T(z,2,) = T(=,)Tl2). line una transformación lineal F de V en W, la matriz de la cual es A, res- 

(c) ¿Cómo se describirá ia imagen de T? Pelo a GB, @'. Resumiendo formalmente se tiene: 


n 

2 Aijt; 

j=l 
el elemento de la ¿ésima fila de la matriz columna AX. Obsérvese también 
s A es cualquier matriz m x n sobre el cuero F, entonces 

fa m fr 
1) T (È 20) = Y A) Bi 
ja 


i=1 = 


6. Sean V y W espacios vectoriales de dimensión finita sobre el cuerpo F. Demostrar q 4 E f r > 
V y W son isomorfos si, y solo si, dim V = dim W. Teorema 11. Sean V un espacio vectorial de dimensión n sobre el cuerpo F, 
W un espacio vectorial de dimensión m sobre F. Sean @ una base ordenada de 
y 45 una base ordenada de W. Para cada transformación lineal T de V en W, 


Existe una matriz m Xx n, A, cuyos elementos pertenecen a F, tal que 
[Tale = Alala 


ra todo vector a en V. Además, T— A es una correspondencia biyectiva entre 
vonjunto de todas las transformaciones lineales de V en W y el conjunto de todas 
matrices m X n sobre el cuerpo F. 


7. Sean V y W espacios vectoriales sobre el cuerpo F y sea U un isomorfismo de V sobre 
Demostrar que T— UTU”! es un isomorfismo de L(V., V) sobre L(W. W). 


3.4. Representación de transformaciones por matrices 


Sea V un espacio vectorial de dimensión n sobre el cuerpo F, y sea W u 
espacio vectorial de dimensión m sobre F. Sea @ = ([a,, ..., 0a,) una base o, 
denada de V, y @' = [f,,..., Bm3 una base ordenada de W. Si T es cualqui 
transformación lineal de Y en W, entonces T está determinada por su efect 
sobre los vectores «j. Cada uno de los n vectores Ta, se expresa de manera úni 
como combinación lineal 


La matriz A, que está asociada a T en el Teorema 11, se llama la matriz de 
Vespecto a las bases urdenadas (B, (R'. Obsérvese que la ecuación (3-3) dice 
A es la matriz cuyas columnas A, ..., A, son dadas por 


m 
mn pl de A Anpe j= [Tao j=1,...,2. 
de los f3,. los escalares A,;, . - - , Amj son las coordenadas de Ta, en la base or t es otra transformación lineal de V en W y B=[B,,..., B,] es la matriz 


U respecto a las bases ordenadas GB, (3', entonces cA + B es la matriz de 
4 U respecto a @, (B'. Esto es claro porque 


cA; + B; = c[Ta;]w + [Ua;Jor 
[cTa; + Uasla 
= [(cT + U)a;]ay. 


denada (B'. Por consiguiente, la transformación T está determinada por | 
mn escalares A¡; mediante la expresión (3-3). La matriz m x n, A, definid: 
por A(i, j) = A;j se llama matriz de T respecto al par de bases ordenadas GH y (B' 
La tarea inmediata es comprender claramente cómo la matriz A determina | 
transformación lineal 7. 


Sia = X% +-:** + Xan es un vector de V, entonces 
n 
Ta = T (3 22) Teorema 12, Sea V un espacio vectorial de dimensión n sobre el cuerpo F. 
y wa cada par de bases ordenadas B, B' de V y W, respectivamente, la función 
= Y z;(Ta;) gue asigna a una transformación lineal T su matriz respecto a @, @' es un iso- 
j=1 Morfismo entre el espacio L(V, W) y el espacio de todas las matrices m x n sobre 


Wl cuerpo E. 


I! 


n m 
225 2 A;ßi T % > 5 
j=l i=l Demostración. Se observó antes que tal función es lineal y, como se es- 
Nableció en el Teorema 11, esta función es inyectiva y aplica L(V, W) sobre el 
wvenjunto de matrices m x n. |] 


mfa 

= È (È An) 6: 
i=1 \j=1 

Si X es la matriz'de las coordenadas de a en la base ordenada ,@, entonces el 

cálculo anterior muestra que 4X es la matriz de las coordenadas del vector 13 

en la base ordenada (3', ya que el escalar 


Estamos particularmente interesados en la representación por matrices de 
las transformaciones lineales de un espacio en sí mismo, es decir, de los opera- 
res lineales sobre un espacio V. En tal caso es más conveniente usar la misma 


PP má a SA AA 


malformaciones lineales 


a a a PP A » AA 
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base ordenada, esto es, hacer @ = GB”, y se dirá simplemente que la matriz 
que la representa es la matriz de T respecto a la base ordenada @. Como e: 
concepto será muy importante para este estudio, repasaremos su definición, 
Si T es un operador linea] sobre un espacio vectorial V de dimensión finita 


y @ = (0,,..., a) es una base ordenada de V, la matriz de T respecto a G (0 (Mit = 0, 
la matriz de T en la base ordenada (B) es la matriz n x n. A, cuyos elementos Mido = 1 
Ai; están definidos por las ecuaciones (Df) = 


= 2 

(3-5) Ta; = È Ayan j=l. O 
i=l 

Se debe recordar siempre que esta matriz que representa a T depende de la bas 

ordenada @, y que existe una matriz que representa a T en cada base ordenad 

para V. (En transformaciones de un espacio en otro la matriz depende de do 

bases ordenadas, una de V y otra de W.) Para no olvidar esta dependencia $ 


usará la notación 


[Dla = 


[Tla 


para la matriz del operador lineal 7 en la base ordenada @. La manera cóm 
esta matriz y la base ordenada describen a T, es que para cada a de V 
g [Tala = [Talala- 
Ejemplo 13. Sea V el espacio de las matrices columnas n x 1 sobre el 
cuerpo F; sea W el espacio de las matrices m x 1 sobre F y sea A una mat 
m x n dada fija sobre F. Sea T la transformación lineal de Y en W definidí 
por T(X) = AX. Sea @ la base ordenada para V, análoga a la base canónic: 
de F”; es decir, el ¡-ésimo vector de GB en la matriz n x 1, X; tiene un 1 en 
fila į y todos los demás elementos 0. Sea @’ la correspondiente base ordenad 
de W; o sea, el j-ésimo vector de (3' es la matriz m x 1, Yj, que tiene, un 1 € 
la fila j y todos los demás elementos 0. Entonces la matriz de T respecto al pa 
GB, @' es la misma matriz A. Ello es evidente, pues la matriz AX; es la ¡-ési 
columna de A. 


B = {an ---, 0%), 


nsi 
Ejemplo 14. Sea F un cuerpo y sea T el operador en F? definido por 


T (€n 22) = (2, 0). 


Es fácil ver que T es un operador lineal en F?. Sea GB la base ordenada canó 
nica de F?, @ = [e,. €,j. Entonces 


Tea = T(1, 0) = (1,0) = le + 0e 
Te = T(0, 1) = (0, 0) = Oc, + Oez 


con lo que la matriz de T en la base ordenada @ es 


iTe = [o o} 


Sea V el espacio de todas las funciones polinomios de R e 


BA. Se puede también 
(UT as) 


fue C = 


Ejemplo 15. 
R de la forma 


fa) = Co + Cr + Cat? + ea? 


AAA 


sy 


ato es, el espacio de las funciones polinomios de grado tres o menor. El opera- 
lor derivación, del Ejemplo 2, aplica Y en V, ya que D «decrece el grado». Sea 
la base ordenada de Y que consta de las cuatro funciones fi, fa, fa, fa de- 
Minidas por f(x) = xi 1. Entonces 


Dfi = Of, + Ofo + Ofe + Ofa 
Df. = 141 + Of2 + Os + Ofa 
Df: = Ofi + 2f + Of + Ofa 


Dfi = 0f1 + Of2 + 3f3 + Ofa 


von lo que la matriz de D en la base ordenada @ es 


0 
0 
gl 
0 


oco0o- 


0 
2 
0 
0 


oooo 


Hemos visto lo que les sucede a las matrices representantes cuando las trans- 
lurmaciones se suman. y es que las matrices se suman. Cabe ahora preguntar. 
pue sucede cuando se componen transformaciones. En forma más precisa, 
W y Z espacios vectoriales sobre el cuerpo F de dimensiones n, m y p, 
mente. Sea T una transformación lineal de Y en W y U una transfor- 
lineal de W en Z. Supóngase que se tienen las bases ordenadas 


E = (Br... 


m los respectivos espacios V, W y Z. 


>, Bm), 


. Sea A la matriz de T respecto al par 


= (Mm)... , Yo) 


M, (3 y sea B la matriz de U respecto al par 63", 3”. Es fácil ver ahora que la 
Motriz C de la transformación UT respecto al par @, @” es el producto de B y A; 
Wi efecto, si x es cualquier vector de V 


[Talar 
[U(To)la” = BlT alar 


Alala 


(UD) 0) la” = BA[ala 


yy luego. por la definición y unicidad de la matriz representante, se debe tener 


ver esto haciendo el cálculo 
U(Tas) 


U ( 3 Aus) 
k=1 


È Ar (UBu) 
kal 


m 


È Au È Bax: 


(ž 2i Balu) Yi 


= Y 


i=l 


Pe POP o 
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con lo que se debe tener 

m 
(3-6) Ci = A, BA; 
Ya se había motivado la definición (3-6) para la multiplicación de matricei 
por operaciones sobre las filas de una matriz. Aquí se ha visto que una moti: 
vación muy convincente para la definición se tiene mediante la composición 
de transformaciones lineales. Resumiendo, tenemos: 


Teorema 13. Sean V, W y Z espacios vectoriales de dimensión finita sob 
el cuerpo F; sea T una transformación lineal de V en W y U una transformació 
lineal de W en Z. Si @, @' y GB” son las bases ordenadas de los espacios V, W 
Z, respectivamente, y si A es la matriz de T respecto al par B, @' y B es la matri 
de U respecto al par G3', B”, entonces la matriz de la composición UT respect 
al par GB, B” es la matriz producto C = BA. 


Obsérvese que el Teorema 13 da una demostración de que la multiplicació 
de matrices es asociativa, demostración que no requiere cálculos y que es i 
dependiente de la dada en el Capítulo 1. Debe señalarse también que en el Ejem 
plo 12 se ha demostrado un caso particular del Teorema 13. 

Es importante hacer notar que si 7 y U son operadores lineales sobre 
espacio V y que si se representa por una sola base ordenada @, entonces el Teor 
ma 13 toma la forma simple [UT]g = [Ulg[7]g- Así, en este caso, la corres 
pondencia que @ determina entre los operadores y las matrices no es solo ul 
isomorfismo del espacio vectorial, sino que también preserva los productos 
Una consecuencia inmediata de lo cual es que el operador lineal T es inversibli 
si, y solo si, [7]g es una matriz inversible. En efecto, el operador identidad 
está representado por la matriz identidad en cualquier base ordenada, y a: 


UT = TU =I 
es equivalente a 
[Ula[T]e = [TlelUle = £. 
Además, cuando T es inversible 
[T-]e = [7]16". 


Quisiéramos ahora investigar qué sucede a la matriz representante cuand 
se cambia la base ordenada. Por razón de simplicidad se considerará solo el 
caso de operadores lineales sobre un espacio V, de modo que solo se tenga uni 
base ordenada. Se trata de lo siguiente. Sea T un operador lineal sobre el es 
pacio de dimensión finita V y sean 


G=(0,.-..,0n) Y m (0,..., 05) 


dos bases ordenadas para V. ¿De qué manera están relacionadas las matrices 
[T]g y [71g:? Como se observó en el Capítulo 2, existe una matriz (inversible) 
n x n, P, única tal que 


(3-7) [ala = Plolo; 


AAA 
ol 


wa cada vector æ en V. Es la matriz P = [P,, ..., P,] con P; = [a]. Por 
lefinición 


1-8) [Tala = [Tlelada. 

Aplicando (3-7) al vector Ta, tenemos 

1-0) [Tala = P[Taler. 

imbinando (3-7), (3-8) y (3-9) se obtiene 
[TlaPlala: = P[T alo 
P-[TlePlala: = [Tolo 

im lo que se debe tener que 

10) [Tle = P-[T]aP. 


Ma es la respuesta del problema. 
Antes de enunciar este resultado queremos observar lo siguiente. Existe 
único operador lineal U que aplica @ sobre @', definido por 


Uaj =~,  j=1,...,n 


è operador U es inversible, ya que aplica una base de Y sobre una base de 
La matriz P (anteriormente citada) es precisamente la del operador U en la 
* ordenada (GB. En efecto, P está definida por 


vomo Ua; = aj, esta ecuación puede escribirse 
n 
Ua;= È Pija. 
i=l 
Asi P = [U]g por definición. 


Teorema 14. Sgá V un espacio vectorial de dimensión finita sobre el cuerpo 
F, y sean 


B=iag im q y OH 10%) 


alos bases ordenadas de V. Supóngase que T es un operador lineal sobre V. Si 


Po [P,, ..., Pa] es la matriz n x n de columnas P; = [«;]g, entonces 
[Tle = P-(TJaP. 


De otra manera, si U es el operador lineal sobre V definido por Ux; = a;. j = 
l, ..., n, entonces 


[T]e = (Ula*TlalUlo. 


e E. Ls 
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Ejemplo 16. Sea T el operador lineal sobre R? definido por T(x,, x,) = 
(xı, 0). En el Ejemplo 14 se vio que la matriz de T en la base ordenada canó: 


nica @ = [e,, €,) es 
trio =[o o} 


Supóngase que 03' es la base ordenada de R?, que consta de los vectores e; = (1, 1 
€, = (2, 1). Entonces 


pr ONTO 1 


sigue que @' = {g1 22, Z3 84) es una base ordenada de V. En el Ejemplo 15 
encontró que la matriz de D en la base ordenada es 


= 2a t+ e 
de modo que P es la matriz ad 
12 _j00 20] 
p=[; 1] De=l0 0 0 3 
Después de un breve cálculo se obtiene A 
Puja e Al matriz de D en la base ordenada (B' es, pues, 
i Con lo que a 1 e e | O aE i E 0 
0 1 -2 310 0 2 O[¡0 1 2  3t? 
y = pa , s 
Url [TlaP MDP =l0 o 1 -3sflooo03fo0 1 x 
i E Me pA 0.0.0 1 llo o o ollo o o 1 
À 1 —IJLO OJL1 1 1 —t e to 1 2 3e 
l [A eli 2 Jo 1-2  3e¡[0 0 2 6 
a 1 —-1]L0 0 -jo 0 1 —3 ||0 0 0 3 
i le 1982 0.0.0 1jLo 0 0 o 
=[ 1 2} 0100 
f Fácilmente se puede comprobar que esto es correcto, pues = o + r- S 
Tá = (1,0) = -á+ € 00.00 


Te = (2,0) = —2e + 2e 


Ejemplo 17. Sea V el espacio de las funciones polinomios de R en R de 


si D estå representada por la misma matriz ẹn las bases ordenadas 6 y @'. 
r supuesto, que ello puede verse en forma directa, ya que 


«grado» menor o igual que 3. Como en el Ejemplo 17, sea D el operador de- Dg =0 

rivación en V y sea Dn = gı 
f 8 = {fofa fa J) Es A 
Dga = 39s- 


la base ordenada de V definida por f(x) = x'”'. Sea f un número real y de- 
fínase g;(x) = (x + 1) ', esto es, 


h=Í 

ga = tfi + fa 

Ya = Pfi + fa + f3 

ga = Ef, + 30f2 + 3tfa + fa. 


te ejemplo ilustra algo importante. Si se conoce la matriz de un operador 
ical en cierta base @ y se desea encontrar la matriz en otra base ordenada GB, 
a menudo más conveniente efectuar el cambio de coordenadas usando la 
atriz inversible P; pero puede ser mucho más simple encontrar la matriz re- 
presentante por una aplicación directa de su definición. 


Como la matriz Definición. Sean A y B dos matrices (cuadradas) n X n sobre el cuerpo F. 


l L te pe Ne dice que B es semejante a A sobre F si existe una matriz inversible n x n, P, 
P= 0.1 2 32 sobre F tal que B = P"*AP. 
0.0 1 3t 
0 0 De acuerdo con el Teorema 14, se tiene lo siguiente: Si V es un espacio vec- 


torial de dimensión n sobre el cuerpo F y @ y @' son dos bases ordenadas de V, 
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entonces para todo operador lineal T sobre V la matriz B = [T] es sem 
jante a la matriz A = [7]g. El razonamiento también es válido a la inversa. 
Supóngase que A y B son matrices n x n y que B es semejante a A. Sea V cual- 
quier espacio de dimensión n sobre F y sea (3 una base ordenada de V. Sea T el 
operador lineal sobre V que está representado en la base @ por A. Si B = P”!AP, 
sea (3' la base ordenada de Y obtenida de GB por P, es decir 


n 
a = Y Pya 
i=] 
Entonces la matriz de T en la base ordenada Ĝ@' será B. 
Así la afirmación de que B es semejante a A quiere decir que en cada es- 
pacio de dimensión n sobre F las matrices A y B representan la misma trans- 
formación lineal en las dos (posibles) bases ordenadas diferentes. 
Obsérvese que toda matriz n x n, A, es semejante a sí misma, tomando 
P = I; si B es semejante a A, entonces A es semejante a B, ya que B'= PAP 
implica que A = (P"*)"*BP"!; si B es semejante a A y C es semejante a B, 
entonces C es semejante a A, pues B = P"'AP y C = Q”*BQ implica que 
C = (PQY *A(PO). Así, pues, la semejanza es una relación de equivalencia 
en el conjunto de las matrices n x n sobre el cuerpo F. Obsérvese también que 
la única matriz semejante a la matriz identidad / es / y que la única matriz se- 
mejante a la matriz nula es la misma matriz nuia. 


Ejercicios 
L. Sea T el operador lineal sobre C? definido por T(x,. X2) = (xı, 0). Sea GB la base or- 
denada canónica de C? y sea @' = (a, æ} la base ordenada definida por x; = (1, 1), 
æ, = (—i, 2). 

(a) ¿Cuál es la matriz de T respecto al par @, GB? 

(b) ¿Cuál es la matriz de T respecto al par @', B? 

(c) ¿Cuál es la matriz de T en la base ordenada @'? 

(d) ¿Cuál cs la matriz de T en la base ordenada (02, æ}? 
2. Sea T la transformación lineal de R? en R? definida por 

T(2,, Za, Ls) = (2, + za, 223 — zı). 

(a) Si GB es la base otdenada canónica de R? y @' es la base ordenada canónica de R?. 
¿cuál es la matriz de 7 respecto al par @, BH? 

(b) Si @ = ia, az, as) y @' = (B,, B2}. donde 

aœ = (1,0, —1), aœ: = (1,1,1), œ= (1,0,0), ĝ = (0,1), z= (1,0) 

¿Cuál es la matriz de T respecto al par GB, @'? 
3. Sea T un operador lineal sobre F”, sea A la matriz de T en la base ordenada canónica 


para F” y sea W el subespacio de F” generado por los vectores columna de A. ¿Qué rela- 
ción existe entre W y T? ` 


4. Sea V un espacio vectorial bidimensional sobre el cuerpo F y sea @ una base ordenada 
de V. Si T es un operador lineal en Y y 


[Tle = ij 5] 


demostrar que T? — (a + d)T + (ad — bol = 0. 


— e Mc A O A A 7 crió. 30 


rmaciones Imeales Ys 


Sea 7 el operador lineal sobre R* cuya matriz en la base canónica es 


2 1 
A= r LE 
-l1 3 


wonirar una base de la imagen de T y una base del espacio nulo de T. 
Seu 7 el operador lincal sobre R? definido por 


T(x, 2) = (— 22, 21). 


(a) ¿Cuál es la matriz de F en la base ordenada canónica de R?? 
(b) ¿Cuál es la matriz de T en la base ordenada @ = {«,, %2}, donde a, = (1, 2) y 


Y — 12 


tc) Demostrar que para cada número real ¢ el operador (T — cf) es inversible. 
ll) Demostrar que si @ es cualquier base ordenada para R? y [T]e = A, entonces 
MoA +O. 


T Sea T el operador lineal en R? definido por 


T(E, La, T3) = (321 + T3, —221 + Ta, — 21 + 222 + 413). 


a Aniza y 33 
la) ¿Cuál es la matriz de T en la base ordenada canónica de R°? 
ib) ¿Cuál es la matriz de T en la base ordenada 


{an an 0) 


inde x, = (1. 0. 1) x, = (—1. 2, 1) y % = (2. 1, 1? 
lc) Demostrar que T es inversible y dar una expresión de 7” ' tal como la que de- 
fimo a T. 


W Sca 0 un número real. Demostrar que las dos matrices siguientes son similares sobre 
wl vuerpo de los números complejos: 
cosO —sen 0], [e 0 
sen  cosó 0 e” 

Wvurerencia: Sea T el operador lineal sobre C? representado por la primera matriz en la 
Ie ordenada canónica. Encontrar entonces vectores x, y 0%, tales que Ta, = cla, Ta, = 
t x, y (Xi. 22) sea una base.) 
Y, Sea V un espacio vectorial de dimensión finita sobre el cuerpo F y sean S y T opera- 
adores lincales sobre V. Se pregunta: ¿cuándo existen dos bases ordenadas B y BH de Y 
tales que [S]g = [7]? Demostrar que tales bases existen si. y solo si, existe un ope- 
tador lincal inversible U en Y tal que T = USU *. (Esquema de la demostración: X [S]e = 
|7 |p- sea U el operador que aplica @ sobre 63 y demostrar que S = UTU”'. Recípro- 
vamenic, si T= USU ' para algún U inversible, sea @ cualquier base ordenada para 
1 y sca GY su imagen por U. Demostrar entonces que [S]e = [7]g--) 
10. Se sabe que el operador lineal T sobre R? definido por T(x,. x2) = (x1, 0) está repre- 
sentado, en la base ordenada canónica. por la matriz 

10 

A [o of 

Este operador cumple T? = /. Demostrar que si S es un operador lineal sobre R? tal que 
5? = S, entonces S = 0, o $ = J, o existe una base ordenada 03 de R? tal que [S]g = 4 
tanteriormente). 
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11. Sea W el espacio de todas las matrices columna n x 1 sobre el cuerpo F. Si A es un Ejemplo 18. Sea F un cuerpo y sean dy, ..., aa escalares pertenecientes 


matriz n x n sobre F, entonces A define un operador lineal L, sobre W por la multiplica 
ción a la izquierda L¿(X) = AX. Demostrar que cada operador lineal sobre W es el pri 
ducto a la izquierda de alguna matriz n x n; es decir, es L4 para algún A. 

Ahora supóngase que V es un espacio vectorial de dimensión n sobre el cuerpo F y qi 
(B es una base ordenada de V. Para cada a: de V se define Ua = [0 ]g. Demostrar que U 
un isomorfismo de V sobre W. Si T es un operador lineal sobre V, entonces UTU”! es ui 
operador lineal sobre W. Por tanto, UTU” ' es el producto a la izquierda por alguna matri 
nx n, A. ¿Cuál es 4? 


F. Defínase una función f en F" por 
fl ---, Tn) = M0 + + F Onin 


es f es un funcional lineal sobre F”. Es el funcional lineal representado 
. , 4] respecto a la base ordenada canónica de F” y la base 


a = fle) j=l... 


odo funcional lineal sobre F” es de esta forma para ciertos escalares a,, . . . , an. 
{llo se sigue de la definición de funcional lineal, ya que definimos a, = fe) 
y empleando la linealidad 


Saw ---,2) =f (Z 2s) 


12. Sea V un espacio vectorial de dimensión n sobre el cuerpo F y sea @ = [a,,... 
una base ordenada de V. 
(a) Conforme al Teorema 1 existe un operador lineal único T sobre V tal que 
Toi=am j=1,...,n—1, Tan = 0. 


¿Cuál es la matriz A de T en la base ordenada @? 


= D zf le 
(b) Demostrar que 7” = 0, pero que 7"! 4 0. A fle) 
(c) Sea S cualquier operador lineal en Y tal que S” = 0, pero con S” ' 4 0. Demi = Y 04; 
trar que existe una base ordenada (3' de V tal que la matriz de S en la base ordenada j 


es la matriz A de la parte (a). 
(d) Demostrar que si M y N son matrices n x n sobre F tales que M” = N” = Q, cı 
M" 1404 N" ?, entonces M y N son semejantes. 


Ejemplo 19. He aqui un ejemplo importante de un funcional lineal. Sea 
m un entero positivo y F un cuerpo. Si A es una matriz n x n con elementos 
un F, la traza de A es el escalar 


trA = Au + A+ +: + An. 


Lu función traza es un funcional lineal en el espacio de las matrices F"*", pues 


13. Sean V y W espacios vectoriales de dimensión finita sobre el cuerpo F y sea T u 
transformación lineal de V en W. Si 


G= fan... An} Y @ = ipn- o y Bmg 


son bases ordenadas de V y W, respectivamente, definase la transformación lineal El 
como en la demostración del Teorema 5: E”-(0,) = ðf,- Entonces, los EP-%, 1 < p < 
1 < q < n, forman una base de L(¥F, W), y así : 


tr (cA + B) = È, (CA ss + Bi) 


c È Aut È Ba 
i=1 i=1 

= ctr A + tr B. 
Ejemplo 20. Sea V el espacio de todas las funciones polinomios del cuer- 
po F en sí mismo. Sea 1 un elemento de F. Si se define 


Lp) = pl) 


“entonces L, es un funcional lineal en V. Es usual describir esto diciendo que, 
para cada £, la «valuación en 1» es un funcional lineal en el espacio de las fun- 
iones polinomios. Habria que advertir que el que las funciones sean polino- 
mios no interviene en el ejemplo. La valuación en £ es un funcional lineal en el 
espacio de todas las funciones de F en F. 


mon 
T= Y Y ApEr 

p=1q=1 
para ciertos escalares A,, y (las coordenadas de T en esta base de L(V, W). Demostrar qui 
la matriz A con elementos A(p, q) = A), es justamente la matriz de T respecto al par G3, 63 


3.5. Funcionales lineales 


Si V es un espacio vectorial sobre el cuerpo F, una transformación line: 
f de V en el cuerpo de escalares F se llama también un funcional lineal sobre V. 
Si se comienza desde el principio, esto quiere decir que f es una función di 


dd Ejemplo 21. Este puede ser el funcional lineal más importante en mate- 


mática. Sea [a, b] un intervalo cerrado del eje real y sea C([a, b]) el espacio de 
las funciones reales continuas sobre [a, b]. Entonces 


Lo) = f, 90 de 


Jefine un funcional lineal L en C([a, b]). 


Fca + 8) = efla) + $(6) 


para todos los vectores « y f de V y todos los escalares ¢ de F. El concepto di 
funcional lineal es importante para el estudio de los espacios vectoriales di 
dimensión finita. pues ayuda a organizar y clarificar el estudio de los sube: 
pacios, las ecuaciones lineales y las coordenadas. 
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Si V es un espacio vectorial, el conjunto de todos los funcionales lineales 
sobre V forman, naturalmente, un espacio vectorial. Es el espacio L(V, F). 
Se designa este espacio por V* y se le llama espacio dual del V: 


V* = L(V, F). 


Si V es de dimensión finita se puede obtener una descripción muy explícita 
del espacio dual V*. Por el Teorema 5 sabemos algo acerca del espacio V*: 


dim V* = dim V. 
Sea 03 = (a,,...,0,) una base de V. Conforme al Teorema 1 existe (para cada i) 
un funcional lineal único f en V tal que 
(3-11) Filas) = ds. 


De esta forma se obtiene de @ un conjunto de n funcionales lineales distint 
fi» --., fa sobre V. Estos funcionales son también linealmente independientes, 
pues supóngase que 


(3-12) f= z cf. 
Entonces 
fla) = E oía) 


[i 


n 

Z Cid; 
i=l 
= Cj. 


En particular, si f es el funcional cero. f(«;) = 0 para cada j y, por tanto, los 
escalares c; son todos ceros. Entonces los f,, ..., f, son n funcionales lineal- 
mente independientes, y como se sabe que V* tiene dimensión n, deben ser 
tales que @* = {fi, ..., f} es una base de V*. Esta base se llama base 
dual de GB. 


Teorema 15. Sea Y un espacio vectorial de dimensión finita sobre el cuer- 
po F y sea B= (a,,..., a.) una base de V. Entonces existe una única base dual 


@* = {fis ..., fay de V* tal que fla,) = 8;,. Para cada funcional lineal fsobre 
V se tiene 
(3-13) f= E SD 


y para cada vector a de V se tiene 


(3-14) a= 2 fa. 
=1 


Demostración. Se ha visto antes que existe una base única que es «dual» 
de (B. Si f es un funcional lineal sobre V, entonces f es una combinación lineal 


11.12) de los f; y, como observamos después de (3-12), los escalares c; vienen 
dados por c, = f(a;). En forma análoga, si 
n 
a= È tia 
i=l 
vs un vector de V, entonces 


fila) = È zif;la:) 
i1 


1 
X] 
a 
E 
ES 


= 2; 
de modo que la expresión única para a, como combinación lineal de los a, es 


Q= 2 Fidas. Il 


La ecuación (3-14) suministra un buen modo de describir qué es la base 
dual. Dice que, si @ = (0, ..., Op} es una base ordenada de V y 
MES A faj es la base dual, entonces f es precisamente la función que 
imigna a cada vector x en V la ¡-ésima coordenada de a respecto a la base orde- 
nuda @. Así que también se pueden llamar los f funciones coordenadas de @. 
La fórmula (3-13), cuando se combina con (3-14), dice que: Si f pertenece a 
I* y si fla) = a; entonces si 

a = tia + -+> +20 
w tiene 


10-15) fla) = 4% + +=: + artn. 


En otras palabras, si se elige una base ordenada @ de V y se expresa cada vec- 
lor en V por su n-tuple de coordenadas (x,, .... x,) respecto a (B, entonces 
vada funcional lineal en V tiene la forma (3-15). Esta es la generalización natu- 
ral del Ejemplo 18, que es el caso especial en que V = F" y @ = ([€,,..., €,). 


Ejemplo 22. Sea V el espacio vectorial de todas las funciones polinomios 
de R en R que tienen grado menor o igual que 2. Sean £,, t,, t} tres números 
teales distintos arbitrarios, y sea 


Lip) = p(t). 
Entonces £,. L, y L, son funcionales lineales sobre V. Estos funcionales son 
linealmente independientes; en efecto, supóngase que 
L = alı + cala + CsLa. 
Si L = 0; es decir, si L(p) = 0 para todo p de V, entonces aplicando L a las 
wlunciones» polinomios particulares 1, x, x?, tenemos 


artata=0 
lic + toca + taca = 0 
da + cs + Be = 0 


AP Ao 
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De aquí se sigue que c, = c, = C3 = 0, porque (como lo indica un ligero cálcu- 
lo) la matriz 


pe 


>: a 
bh tl tb 
úl E 


es inversible cuando ?,, t, y t, son distintos. Entonces los L; son independien- 
tes, y como V tiene dimensión 3, estos funcionales forman una base de V*, 
¿Cuál es la base de V de la que ésta es la dual? Tal base [p,, p2, p3) de V debe 
satisfacer 


Lí(ps) = ôi 
o 
pilt) = ôi; 
Estas funciones polinomios son, como se ve bien fácilmente, 
- (6 tr - h) 
me) = DA) 
_@- iz- 4) 
P) = 6 e) 
E (2 — t)(a — to) 


(ta — ti) (ta — to) 


La base (p,, pz, pa) para V es interesante, ya que de acuerdo con (3-14) se tiene 
para cada p en V 


p = plti)pi + p(t)p + plto)ps. X 


Con lo que, si c,, c, y cz son números reales cualesquiera, existe exactamente 
una función polinomio p sobre R que tiene grado a lo más 2 y satisface a p(t;) =C;, 
j= 1,2, 3. Esta función polinomio es p = C,p, + C2p, + C3p3. 
Sea estudiar ahora la relación entre los funcionales lineales y los subespa-= 
cios. Si f es un funcional lineal no nulo, entonces el rango de f es 1, ya que la 
imagen de f es un subespacio no nulo del cuerpo escalar y debe ser (por tanto) 
el cuerpo escalar. Si el espacio de referencia V es de dimensión finita, el rangi 
más la nulidad (Teorema 2) nos dice que el espacio nulo N, tiene dimensión 
dim N; = dim V — 1. 

En un espacio vectorial de dimensión n, un subespacio de dimensión n — 1 
se llama un hiperespacio. Tales espacios se llaman también a veces hiperplanos 
o subespacios de codimensión 1. ¿Es todo hiperespacio el espacio nulo de un 
funcional lineal? Se ve fácilmente que la respuesta es sí. No es mucho más difí- 
cil demostrar que todo subespacio de dimensión d es la intersección de los es- 
pacios nulos de (n — d) funciones lineales (Teorema 16, más adelante). 


Definición. Si V es un espacio vectorial sobre el cuerpo F y S es un subconjun- 
to de V, el anulador de S es el conjunto S° de funcionales lineales f sobre V tales 
que fla) = 0 para todo a de S. 


Acma a a a yáyqO O AS XA ARA E 
Transformaciones lineales 


Debería ser claro para el lector que S° es un subespacio de V*, sea o no 
S un subespacio de V. Si S es el conjunto que consta del solo vector cero, en- 
tonces S° = Y*, Si S = V, entonces S° es el subespacio cero de V*. (Esto es 
fácil de ver cuando V es de dimensión finita.) 


Teorema 16. Sea V un espacio vectorial de dimensión finita sobre el cuer- 
po F y sea W un subespacio de V. Entonces 


dim W + dim WO = dim V. 


Demostración. Sea k la dimensión de W y ([a,, ..., 0) una base de W. 
Se eligen vectores %y + ;, ..., %, en V, de modo que {q;; ..., an} sea una base para V. 
Sea [fi ..., fa} la base de V* que es dual de esta base de V. Se afirma que 


iris ===> J} es una base del anulador W°. Efectivamente, f; pertenece a W° 
para ¿> k + 1, ya que 


Íia;) = ôi 


y ðp=0sii> k +1 yj < k; de esto se sigue que, para i > k + 1, fla) = 0 
siempre que a sea una combinación lineal de &;, . . . , «p. Los funcionales R41,- -s 
f, son independientes, de modo que todo lo que se debe demostrar es que ge- 
neran W°. Supóngase que f está en V*. Entonces 


J= E Sad 
de modo que si f está en W° se tiene f(œ;) = 0 para i < k y 
f= È Sad 
i=k+1 


Hemos mostrado que si dim W = k y dim V = n, entonces dim W° = 
n-k. I 


Corolario. Si W es un subespacio de dimensión k de un espacio vectorial 
V de dimensión n, entonces W es la intersección de (n — k) hiperespacios en V. 


Demostración. Este es un corolario de la demostración del Teorema 16 
más bien que su enunciado. Con la nomenclatura de la demostración, W es 
justamente el conjunto de los vectores a tales que f(x) =0,¿=k+1,...,n. 
En caso de que k = n — 1, W es el espacio nulo de f. Ẹ 


Corolario. Si W, y W, son subespacios de un espacio vectorial de dimen- 
sión finita, entonces W, = W, si, y solo si, W? = W}. 


Demostración. Si W, = W,, entonces es claro que W? = W3. Si W, + W,, 
entonces uno de los dos subespacios contiene un vector que no está en el otro. 
Supóngase que hay un vector «œ que está en W,, pero no en W,. Por el corola- 
rio anterior (o por la demostración del Teorema 16), existe un funciónal lineal 
f tal que f($) = 0 para todo f de W,, pero fla) + 0. Entonces f está en W?, 
pero no en WI y W? + W}. 
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En la sección siguiente se darán demostraciones distintas para estos di 
corolarios. El primer corolario dice que, si se elige una base ordenada del 
pacio, cada subespacio de dimensión k puede describirse dando (n — k) con 
diciones lineales homogéneas para las coordenadas respecto de esa base. 

Obsérvese, ahora, el sistema de ecuaciones lineales homogéneas desde el 
punto de vista de los funcionales lineales. Supóngase que se tiene un sistema 
lineal de ecuaciones 


Anti + +=: + Amtn =0 


AE FAO 


del que se quiere encontrar sus soluciones. Si se designa por f; i= 1,...,m 
al funcional lineal en F" definido por 


Filan - - - , 2n) = Aati + +++ + Ainan 
entonces se busca el subespacio de F” para todos los x tales que 
fila) = 0, 


En otras palabras, se busca el subespacio anulado por fi, .... fm. La reduc- 
ción por filas de la matriz de los coeficientes da un método sistemático para 
encontrar este subespacio. El n-tuple (Ai, ..., Ain) da las coordenadas del 
funcional lineal f; respecto a la base que es dual a la base canónica de F”. El 
espacio de las filas de la matriz de los coeficientes puede. pues. considerarse 
como el espacio de los funcionales lineales generado por fi... fa- El espacio 
solución es el subespacio anulado por este espacio de funcionales. 

Ahora se puede considerar el sistema de ecuaciones desde el punto de vista 
«dual». Esto es, supóngase que se den m vectores de F” 


ai = (An, -- -s Aim) 


i=1,...,m. 


y que se desea hallar el anulador del subespacio generado por estos vectores. 
Como un funcional lineal típico sobre F” tiene la forma 


HC E ee H Cata 
la condición de que f esté en este anulador es que 


SA eD E fe dei 
al 


esto es, que (c4... c, ) sea una solución del sistema AY = 0. Desde este punto 
de vista, la reducción por filas da un método sistemático para hallar el anula- 
dor del subespacio generado por un conjunto finito de vectores de F". 


Ejemplo 23. He aquí tres funcionales lineales sobre R*: 


Íi(%1, T2, Ts, La) = Tı + Lt2 + 213 + 2a 
S(T, T2, T3, T4) = Lar + T4 
Flt, Lo, La, La) = —2x1 — 4ra + 324. 
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El subespacio que anulan puede ser encontrado explícitamente hallando la 
matriz escalón reducida por filas de la matriz 


12 2 1 
A= 0 2 0 1f 
—2 0 —4 3 


Un cálculo breve, o una observación del Ejemplo 21 del Capítulo 2, muestra que 


1020 
R=|0 1 0 0f 
0001 


Por tanto, los funcionales lineales 


Yaltr, Lo, Za, 24) = 11 + 224 
Ga(Ls, La, La, T4) = La 
Ya(Z1, T2, Ta, T4) = T4 


generan el mismo subespacio de (R*)* y anulan el mismo subespacio de R* 
como lo hacen f,, f2, f3. El subespacio anulado consta de los vectores con 
a = —2% 
T = 4 = 0. 
Ejemplo 24. Sea W el subespacio de R5 generado por los vectores 
a = (2, —2, 3, 4, —1), a = (0, 0, —1, —2, 3) 
a: = (—1, 1, 2, 5, 2), œ = (1, —1, 2, 3, 0). 
¿Cómo se puede describir W°, anulador de W? Formando la matriz 4 x 5, A, 


con vectores filas a,, %,, %3, 44, y se encuentra la matriz escalón reducida por 
filas R que es equivalente por filas a 4: 


y O A 1 =10 -1 0 
0 A lo 01 20 

e A A da CA 
A A 0. 00 00 


Si f es un funcional lineal sobre R*: 


San. e, 75) = 3 Ct; 
j=1 


entonces f está en WO si, y solo si, f(a;) = 0, i = 1, 2, 3, 4; es decir, si, y solo si, 


5 
E Asc =0, 1S8i<4 
j= 
Esto es equivalente a 
5 
E Rao =0, 1<i<3 
j=1 


a=a—-a=0 
Ca + 2c = 0 
Cs = 0. 


A, AS AA ASAS AA AA A AAA dis ció. a ds O 
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Todos estos funcionales lineales f se obtienen asignando valores arbitrarios 
a C, y Ca, por ejemplo, c, = au y c, = b, y a continuación hallando los corres- 
pondientes c, = a + b, c} = —2b, c5 = 0. 

Con lo que W° consta de los funcionales lineales f de la forma 


Í(<1, La, Ts, La, 2) = (a + b)x, + azz — Zbx3 + bza. 


La dimensión de W° es 2, y una base (f,, f2} para W° puede encontrarse pri- 
meramente tomando a = 1, b = 0, y entonces a = 0, b = 1: 


Silu . - . , T6) = Tı + Ze 
SalEn - . - , 25) = Zi — 2ta F Ta. 


El f anterior general en W° es f = af, + bf- 


Ejercicios 
L. En R?, sea a = (1, 0, 1) az= (0, 1, —2), «= (—1, —1, 0) 
(a) Si f es un funcional lineal sobre R? tal que 


fa) =1, fæ) =—1,  fa)=3, 
y si a = (a, b, c), hallar f(a). 
(b) Describir explícitamente un funcional lineal f sobre R? tal que 


Fo) = f(a) = 0 pero f(a) 0. 


(c) Sea f cualquier funcional lineal tal que 


Fa) =f0)=0 y fla) #0. 
Si a = (2, 3, —1), demostrar que fla) + 0. 
2. Sea @ = (%,, a2, %) la base para C? definida por 
a=(1,0,—1) ua =(1,1,1) œ = (2, 2, 0). 
Hallar la base dual de G. 


3. Si A y B son matrices n x n sobre el cuerpo F, demostrar que traza (4B) = traza (BA). 
Entonces demostrar que las matrices semejantes tienen la misma traza. 


4. Sea V el espacio vectorial de todas las funciones polinomios p de R en R que tienen 
grado 2 o menor: 


P(T) = o + uz + car? 


Se definen tres funciones lineales sobre V por 
1 2 -1 
50) = [nod Sp) = rad, fp) = [no dz. 


Demostrar que (f,, fa, fa) es una base de V*, presentando la base de V de la cual ésta 
es dual. 


5. Si A y B son matrices complejas n x n, hacer ver que es imposible que AB — BA = I. 


IN. std. cs ci A 
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6. Sean m y n enteros positivos y F un cuerpo. Sean f,, .. . , fa funcionales lineales en F”. 
Para a en F” se define 


Ta = (fila), - - - ,Jm(a)). 


Demostrar que T es una transformación lineal de F" en F”. Demostrar luego que toda 
transformación lineal de F” en F” es de la forma anterior para ciertos fi, ..., fm- 


7. Sea a, = (1, 0, —1, 2) y a, = (2, 3, 1, 1) y sea W el subespacio de R* generado por 
X, y %. ¿Qué funcionales lineales f: 
Í(%1, Ta, La, T4) = CTi + Cota + Cata + Cata 

están en el anulador de W? 
8. Sea W el subespacio de R* generado por los vectores 

a= atetea œ = & + 3a + 361 + €s 

0% = € + 4e: + bes + 464 + €s 
Hallar una base de W°. 
9. Sea V el espacio vectorial de todas las matrices 2 x 2 sobre el cuerpo de los números 


reales, y sea 
2 -2 
B= E z], 


Sea W el subespacio de V que consta de todas las A tales que 4B = 0. Sea f un funcional 
lineal sobre V que está en el anulador de W. Supóngase que f(1) = 0 y f(C) = 3, donde 
cs la matriz identidad 2 x 2 y 
0 0 
a [o iji 


10. Sea F un subcuerpo de los números complejos. Se definen n funcionales lineales en 
F" (n > 2) por 


Hallar /(B). 


A ELES 
P> 


¿Cuál es la dimensión del subespacio anulado por fi, ..., f,? 


Ml. Scan W, y W, subespacios de un espacio vectorial Y de dimensión finita. 
(a) Demostrar que (W, + W} = WN MW. 
(b) Demostrar que (W, NW, = W? + W3. 


12. Sea V un espacio vectorial de dimensión finita sobre el cuerpo F y sea W un subespa- 
cio de V. Si f es un funcional lineal sobre W, demostrar que existe un funcional lineal g 
sobre V tal que g(a) = fla) para todo a del subespacio W. 


13. Sea F un subcuerpo del cuerpo de los números complejos y sea Y cualquier espacio 
vectorial sobre F. Supóngase que f y g son funcionales lineales sobre V tales que la función 
h definida por ha) = f(a)g(a) sea también un funcional lineal sobre V. Demostrar que 
f=00 2=.0. 


14. Sea F un cuerpo de característica cero y sea V un espacio vectorial de dimensión finita 
sobre F. Si %;, ..., 0, son un número finito de vectores de V, distintos del vector nulo, de- 
mostrar que existe un funcional lineal f sobre V tal que 


fa) 0, y LN 


A a ts 
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15. De acuerdo con el Ejercicio 3, las matrices semejantes tienen la misma traza. Ento: 
se puede definir la traza de un operador lineal en un espacio de dimensión finita como 
traza de cualquier matriz que represente al operador en una base ordenada. Esta está bi 
definida, ya que todas las matrices que representan un operador son semejantes. 
Sea ahora V el espacio de todas las matrices 2 x 2 sobre el cuerpo F y sea P una matri 
2 x 2 dada. Sea T el operador lineal sobre V definido por T(4) = PA. Demostrar q 
traza (T) = 2 traza (P). 
16. Demostrar que el funcional traza de una matriz n x n es único en el siguiente sentido, 
Si W es el espacio de las matrices n x n sobre el cuerpo F y si f es un funcional lineal sobr 


W tal que f(AB) = f(BA) para todo A y B de W, entonces f es un múltiplo escalar de |, 
función traza. Si además f(1) = n, entonces f es la función traza. 


17. Sea W el espacio de las matrices n x n sobre el cuerpo F y sea Wo el subespacio 
nerado por las matrices C de la forma C = AB — BA. Demostrar que W, es exactamen 
el subespacio de las matrices que tienen traza cero. (Indicación: ¿Cuál es la dimensión 
espacio de las matrices de traza cero? Considerar las matrices «básicas», es decir, las ma: 
trices que tienen solo un elemento no nulo, para construir suficientes matrices linealmente 
independientes de la forma AB — BA.) 


3.6. El doble dual 


Una pregunta respecto a bases duales que no se contestó en la sección an: 
terior, era si toda base de V* es la dual de alguna base de V. Una posibilida 
de contestar esta pregunta es considerar V**, espacio dual de V*., 

Si a es un vector de V, entonces œ induce un funcional lineal L, sobre V* 
definido por 


Laf) am Fa), 


El hecho de que L, sea lineal no es más que una reformulación de la definición 
de las operaciones lineales en Y*: 


Lalf + 9) = ($ + g)(a) 
(cf(a) + gla) 
fia) + gla) 
cLalf) + Lalg). 


Si V es de dimensión finita y a + 0, entonces L, + 0; en otras palabras, existe 
un funcional lineal f tal que f(a) + O. La demostración es muy simple y fue 
dada en la Sección 3.5: Elíjase una base ordenada @ = {ar -- -s €n} de V tal 
que 0, = a, y sea f el funcional lineal que asigna a cada vector en V su primera 
coordenada en la base ordenada G. 


e 


Teorema 17. Sea Y un espacio vectorial de dimensión finita sobre el cuer- 
po F. Para cada vector a de V se define 


LN = fa)  f en V*. 


La aplicación a — L, es entonces un isomorfismo de V sobre V**. 


-—. nar APA AA 
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Demostración. Hemos mostrado que para todo a la función L, es lineal. 
Supóngase que a y f pertenezcan a V y c a F, y sea y = ca + f. Entonces para 
cada f en V* 


LAR = Sw) 
= f(ca + B) 
= fa) + f8) 
= cLa(f) + Lx(f) 
asi 
d Ly = cla + Lo- 


Esto muestra que la aplicación «— L, es una transformación lineal de V en 
J**. Esta transformación es no singular; en efecto, de acuerdo con las obser- 
vaciones anteriores L, = 0 si, y solo si, a. = 0. Entonces a — L, es una trans- 
formación lineal no singular de V en V**, y como 


dim V** = dim V* = dim V 


el Teorema 9 afirma que esta transformación es inversible y es, por tanto, un 
isomorfismo de V sobre V**. J 


Corolario. Sea V un espacio vectorial de dimensión finita sobre el cuerpo F. 
Si L es un funcional lineal en el espacio dual V* de V, entonces existe un único 
vector a de V tal que 


LU) = fa) 
para todo f de V*. 


Corolario. Sea V un espacio vectorial de dimensión finita sobre el cuer- 
po F. Toda base de V* es dual de alguna base de V. 


Demostración. Sea B* = (f,,..., fa} una base de V*. Por el Teorema 15, 
existe una base (£L,, ..., La} de V** tal que 


LJ) = Si. 
Por el corolario anterior, para toto i existe un vector a, de V tal que 
Li(f) = f(as) 


para todo f de V*; es decir, tal que L; = La,. Se sigue inmediatamente que 
(0%, <- -3 On} es una base de V y que @* es la dual de esta base. f 


En vista del Teorema 17 es corriente identificar a con L, y decir que V «es» 
el espacio dual del V*, o que los espacios V, V* están naturalmente en mutua 
dualidad. Cada uno es el espacio dual del otro. En el último corolario se tiene 
una ilustración de lo útil que esto púede ser. He aquí otra ilustración. 

Si E es un subconjunto de V*, entonces el anulador £? es (técnicamente) 
un subconjunto de V**. Si se decide identificar V y V** como en el Teorema 17, 
entonces E” es un subespacio de V, vale decir el conjunto de todos los a de Y 
tales que f(a) = 0 para todos los f de E. En un corolario del Teorema 16 hemos 


iS a 
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observado que cada subespacio W está determinado por su anulador W°. ¿Cómo 
está determinado? La respuesta es que W es el subespacio anulado por todos 
los f de W°; esto es, la intersección de los espacios nulos de todos los f en W°. 
Con nuestra actual nomenclatura para anuladores, la respuesta puede escri- 
birse en forma muy simple: W = (W°). 


Teorema 18. Si S es cualquier subconjunto de un espacio vectorial de di- 
mensión finita V, entonces 1S%% es el subespacio generado por S. 


Demostración. Sea W el subespacio generado por S. Es claro que W° = S°. 
Por tanto, lo que se debe demostrar es que W = W°, Ya se ha dado una de- 
mostración. He aquí otra. Por el Teorema 16 


dim W + dim W° = dim V 
dim W° + dim W% = dim V* 
y como dim V = dim V*, se tiene 


dim W = dim W“. 
Como W es un subespacio de W°, se ve que W = W%. J 


Los resultados de esta sección son válidos para espacios vectoriales arbi- 
trarios; sin embargo, las demostraciones requieren el uso del llamado axioma 
de elección. Queremos evitar enredarnos en una larga discusión de ese axioma, 
de modo que no se abordarán los anuladores en espacios vectoriales generales. 
Pero hay dos resultados respecto a funcionales lineales en espacios vectoriales 
arbitrarios, tan fundamentales, que se daran a continuación. 

Sea V un espacio vectorial. Queremos definir hiperespacios en V. A menos 
que V sea de dimensión finita, no se puede hacer eso considerando la dimensión 
del hiperespacio. Pero se puede expresar la idea de que un espacio N tiene apenas 
una dimensión menos que V, de la siguiente forma: 


1. N es un subespacio propio de V; 


2. si W es un subespacio de V que contiene a N, entonces W = N o 
W =yV, 


Las condiciones (1) y (2) en conjunto dicen que N es un subespacio propio y 


que no existe un subespacio propio mayor; vale decir, N es un subespacio pro- 
pio maximal. 


Definición. Si V es un espacio vectorial, un hiperespacio en V es un subes- 
pacio propio maximal de V. 


Teorema 19. Si f es un funcional lineal 10 nulo sobre el espacio vectorial V, 
entonces el espacio nulo de f es un hiperespecio en V. Recíprocamente, todo hi- 
perespacio de V es el espacio nulo de un (no único) funcional lineal no nulo sobre V. 


Demostración. Sea f un funcional linea no nulo sobre V y N, su espacio 
nulo. Sea a un vector de V que no esté en N,;2s decir, un vector tal que f(a) + 0. 


ENT 1: A o AAA 
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Se demostrayrá que todo vector de V está en el subespacio generado por Np y a. 
Ese subesParcio consta de todos los vectores 


y + Ca, y en Np, c en F. 
Sea 8 en Vr Se define 


18) 
= ia) 


que tiene Stentido porque f(a) + O. Entonces el vector y = f — ca pertenece 
a Ny, ya Que 


$) = FB — ca) 
= $(8) — fla) 
=0. 


Con lo que $ está en el subespacio generado por Np y a. 

Sea ahOra N un hiperespacio en V. Sea œ algún vector que no pertenece 
a N. Como, y es un subespacio propio maximal, el subespacio generado por N 
y a es todo el espacio V. Por tanto, todo vector £ de V tiene la forma 


B=y+ca, 


El vector W% y el escalar c están univocamente determinados por $. Si se tiene 
también que 


yen N, c en F. 


B=y +c'a, y" en N, cen F 
entonces 

(cd =p>1- 
Si c' — € 34 0, entonces a estaría en N; luego c' = c¢ y y'= y. Otra manera 
de formular esta conclusión es: Si $ pertenece a V, existe un único escalar c 
tal que $ —_ ca pertenece a N. Sea g(f) ese escalar. Es fácil ver que g es un fun- 
cional linea] en Y y que N es el espacio nulo de g. Ẹ 


Lema. Si f yg son funcionales lineales en el espacio vectorial V, entonces 
g es un Múltiplo escalar de f si, y solo si, el espacio nulo de g contiene al espacio 
nulo de f3 esto es, si, y solo si, fla) = O implica que g(a) = 0. 


Demostración. Si f = 0 entonces también g = 0 y g es tivinen bo: 
múltiplo escalar de f. Supóngase que f + 0 de modo que el espacio nulo Ay 
sea un hiþerespacio en V. Elíjase algún vector a en V con fla) + 0, y sea 


= Ko), 

Ja) 
El funcional] lineal A = g — cf es O sobre N,, ya que tanto f como g son ahí 0 
y h(a) = ig(a) — cfla) = 0. Así h es O en el subespacio generado por Np y a 
—y ese Shibespacio es V. Se concluye que h = 0; es decir, que g = cf. 


c 


Teorema 20. Sean g, fi, ---, f, funcionales lineales sobre un espacio vec- 
iworial V Con espacios nulos N, N,, ..., N,, respectivamente. Entonces g es una 
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combinación lineal de los fı, . 
MM NN. 


«== f si, y solo si, N contiene la intersecci 


Demostración. Si g= cfi +`: + cf, y fia) =0 para todo i, ento 
ces evidentemente, g(a) = 0. Por tanto, N contiene NEALE NA 

Demostraremos el reciproco (la parte «si» del teorema) por inducción so- 
bre el número r. El lema precedente se refiere al caso en que r = 1. Supóngase 
que el resultado sea válido para r = k — 1 y sean fi, ..., f funcionales lineales 
con espacios nulos Ny, ...., N, tales que N, N -A N, está contenido en N, el 
espacio nulo de g. Sean g', fí, -.., fi-1 las restricciones de g, fie e aea al 
subespacio N,- Entonces g', fi, ..., f_, son funcionales lineales sobre el es- 
pacio vectorial Ny. Además, si a es un vector de N, y (a) = 0,i = 1,...,k — 1, 
entonces a está en M, (+++ A Ne con lo que g'(a) = 0. Por la hipótesis de 
inducción (el caso r = k — 1), existen escalares c; tales que 


ER RA 

Sea ahora 

(8-16) PSA 
i=l 


Con lo que h es un funcional lineal en V y (3-16) dice que A(«) = 0 para todo 
a en N,. Por el lema anterior A es un múltiplo escalar de h- Si h = cz fi, entonces 


k 
o PA de I 


Ejercicios 


1. Sean un entero positivo y Fun cuerpo. Sea Wel conjunto de todos los vectores (x4, . 
de F” tales que x, +- + x, = 0. 


(a) Demostrar que W° consta de todos los funcionales lineales f de la forma 
E 


(b) Hacer ver que el espacio dual W* de W puede identificarse «naturalmente» con 
los funcionales lineales 


-o Xp) 
n 

12n) =C Y Tj 
j=1 


Kan- o, En) = ati H --> + Enta 
sobre F” que satisface c, +--> + €, =0. 


2. Usando el Teorema 20, demostrar lo siguiente. Si W es un subespacio de un espacio 
vectorial de dimensión finita V y si {81> - - -> 8,) €s cualquier base para W°, entonces 


W= A No 


i=] 
3. Sea S un conjunto, F un cuerpo y V(S; F) el espacio de todas las funciones de S en F: 


P+D) = f(z) + g(2) 
(Na) = ef(z). 


Sea W cualquier subespacio de dimensión n de V(S; F 


A ). Demostrar que existi 
Xis -=s X, €n S y funciones f;, . q en puntos 


-+> fa en W tales que fi(x;) = ôy- 


Transformaciones lineales 


3.7. Transpuesta de una transformación lineal 


Supóngase que se tienen dos espacios vectoriales V y W sobre el cuerpo F 
y una transformación lineal T de V en W. Entonces T induce una transfor- 
mación lineal de W* en V*, como sigue. Supóngase que g es un funcional lineal 
en W, y sea 


(3-17) fla) = g(Ta) 


para cada a en V. Entonces (3-17) define una función f de V en F, que es la com- 
posición de T, función de V en W, con g, función de W en F. Como ambas, 
T y g, son lineales, el Teorema 6 dice que f es también lineal; vale decir, f es 
una función lineal en V. Así T suministra una correspondencia T' que asocia 
a cada funcional lineal g sobre W un funcional lineal f = T'g sobre V, defini- 
do por (3-17). Obsérvese también que 7' es igualmente una transformación 
lineal de W*; en efecto, si g, y g, están en W* y c es un escalar 


[T (091 + gala) = (e + 9 (Ta) 
en(Ta) + g(Ta) 
c(T'g)(a) + (T gala) 


de modo que T'(cg, + g,) = cT'g, + T'g,. Resumamos. 


Teorema 21. Sean V y W espacios vectoriales sobre el cuerpo F. Para toda 
transformación lineal T de V en W, existe una única transformación lineal T" de 
W* en V* tal que 

(TgMa) = g(Ta) 


para todo g de W* y todo a de V. 


A T' se la llama transpuesta de T. Esta transformación 7* también se llama 
a menudo adjunta de T, pero no usaremos esta terminología. 


Teorema 22. Sean V y W espacios vectoriales sobre el cuerpo F y sea T una 
transformación lineal de V en W. El espacio nulo de T" es el anulador de la imagen 
de T. Si V y W son de dimensión finita, entonces 

(i) rango (T') = rango (T) 
(ii) la imagen de T' es el anulador del espacio nulo de T. 


Si g pertenece a W*, entonces por definición 
(T'g)(a) = g(Ta) 


para todo x de V. La afirmación de que g está en el espacio nulo de T" quiere 
decir que g(Tx) = 0 para todo a de V. Así el espacio nulo de T" es, precisa- 
mente, el anulador de la imagen de 7. 

Supóngase que V y W son de dimensión finita, por ejemplo, dim V = n 
y dim W = m. Para (i): Sea r el rango de T, es decir, la dimensión de la imagen 
de T. Por el Teorema 16 el anulador de la imagen de T tiene entonces dimen- 


Demostración. 
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sión (m — r). Por la primera afirmación de este teorema la nulidad de 7* de 
ser (m - r). Pero entonces, como 7T“ es una transformación lineal en un espacio 
de dimensión m, el rango de T" es m — (m — r) = r, y así T y T' tienen el mismo 
po Para (ii): Sea N el espacio nulo de 7. Todo funcional en la imagen de 
está en el anulador de N; en efecto, supón; a ú 
; » gase que f = T'g pa 
en W*; entonces, si a está en N be Dt 


Fla) = (Ta) = g(Ta) = g(0) = 0. 
Ahora bien, la imagen de 7* es un subespacio del espacio N°, y 


l dim N° = n — dim N = rango (T) = rango (7*) 
con lo que la imagen de 7* debe ser, exactamente, N°. Il 


Teorema 23, Sean V y W espacios vectoriales de di ión fini 

3 imensión finita sobre 
el cuerpo F. Sea @ una base ordenada de V con base dual B*, y sea B' una base 
ordenada de wW con base dual @'*. Sea T una transformación lineal de V en W; 
sea A la matriz de T respecto a GB, @' y sea B la matriz de T' respecto a B'*, @*. 


Entonces Bij = Aj. 


Demostración. Sea 
G = (a, -..,0n), @' = (Br... Bm), 
G* = Ue - . Say Br = (01, - - - , 9m)- 
Por definición, 
m 
Taj = 2 Abs j=1l...,n 
T'g = 3 Bifa a O A 
Por otro lado, k 
(T'9;)(a:) = g;(Ta;) 
5 a( y Anba) 
k=1 


= 2 Arigí(Br) 


= Y Ary 
k=l 
= As 
Para cualquier funcional lineal f sobre V 
s= 2 Fla:)fi- 


Si se aplica esta fórmula z ional f = T' i 
ES pd ula al funcional f = T'g; y se considera que (T"g,)(0;) = Aj, 


T'g; = EA 


de donde se desprende en forma inmediata que B; = Aj. U 


SS — E”; PP€> PO RARA Á 


Trunsformaciones. lineales 


AAA 
— od 
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Definición. Si A es una matriz m x n sobre el cuerpo F, la transpuesta de 
A es la matriz n x m, A!, definida por Aij = Ai- 


El Teorema 23 dice, pues, que si 7 es una transformación lineal de V en W, 
cuya matriz con respecto a un par de bases es A, entonces la transformación 
transpuesta 7* está representada, en el par de bases dual, por la matriz trans- 
puesta 4. 


Teorema 24. Sea A cualquier matriz m x n sobre el cuerpo F. Entonces 
el rango de filas de A es igual al rango de columnas de A. 


Demostración. Sea @ la base ordenada canónica de F" y (U3' la base ordena- 
da canónica de F”. Sea T la transformación lineal de F” en F” tal que la matriz 
de T respecto al par GB, (B' sea A; es decir, 


Tlah -.-, Tn) = (Y, - - - Um) 


donde 
n 
Yi = Y Asjtj. 
j=l 
El rango de columnas de A es el rango de la transformación T, pues la imagen 
de T consta de todos los m-tuples que son combinaciones lineales de los vec- 
tores columnas de A. 

Respecto a las bases dual (3'* y @*, la aplicación transpuesta T' está re- 
presentada por la matriz A". Como las columnas de A! son las filas de A, se ve 
que por la misma razón que el rango de filas de A (el rango de columnas de A!) 
es igual al rango de 7*. Por el Teorema 22, T y T' tienen el mismo rango y, por 
tanto, el rango de filas de A es igual al rango de columnas de A. | 


Ahora vemos que si Á es una matriz m x n sobre F y T es la transformación 
lineal de F” en F” definida anteriormente, entonces 


rango (T) = rango de filas (4) = rango de columna (4) 
y se dirá simplemente que este número es el rango de A. 


Ejemplo 25. Este ejemplo será de carácter general; más bien una discu- 
sión que un ejemplo. Sea V un espacio vectorial de dimensión n sobre el cuer- 
po F y sea T un operador lineal sobre V. Supóngase que @ = (9, ..., On} 
es una base ordenada de V. La matriz de T en la base ordenada G está definida 
como la matriz n x n, A, tal que 


Ta; = È Aijai 
j=1 


o sea, que 4; es la i-ésima coordenada del vector Ta, en la base ordenada GB. 
Si {f> -- -> J} es la base dual de (3, esto puede enunciarse simplemente 


Ai = f:(Ta;). 


—»> n 


http://libreria-universitaria.blogspot.com 


6 Sea n un entero positivo y sea V el espacio de las funciones polinomios sobre el cuerpo 
sle los números reales que tienen grado n a lo más; es decir, funciones de la forma 


f£) = ot azt -o H em. 


Se verá ahora qué sucede cuando se cambia de base. Supóngase que 
@' = (af,..., ar) 


es otra base ordenada de V con base dual ‘fy, ..., fj- Si B es la matriz de T 


Sea D el operador derivación sobre V. Hallar una base del espacio nulo del operador trans- 
la base ordenada (B”, entonces 


puesto D'. 
7. Sea V un espacio vectorial de dimensión finita sobre el cuerpo F. Demostrar que T— T 
ex un isomorfismo de L(V, V) sobre L(V*, V*). 
B. Sea V el espacio vectorial de las matrices n x n sobre el cuerpo 

(a) Si B es una matriz n x n dada, se define una función fs sobre V por fp(4) = tra- 
za (B'A). Demostrar que f es un funcional lineal en V. ] > 

(b) Demostrar que todo funcional lineal sobre V es de la forma anterior, es decir, es 
fu para algún B. 
į tc) Demostrar que B— fg es un isomorfismo de V sobre V*. 


Bi; = f(To). 


Sea U el operador linea! inversible, tal que Ux; = x;. Entonces la transpuesta 
de U viene dada por U'f; = f;. Esto es de fácil verificación. ya que como U es 
inversible, también lo es U' y (U')*=(U7!Y. Así, f; = (U~ ŻY f, ¡=1,2,...,n 
Por tanto, 


Bi; = [(U-94 (Ta) 
f(UTa)) 


= f(U-"TUa). 
Y ahora, ¿qué dice esto? Bien, JAU- 'TUx;) es el elemento i. j de la matri 
U`'TU en la base ordenada (3. Los cálculos anteriores indican que este escalar: 
es también el elemento į, j de la matriz de T en la base ordenada GB”. Es decir, que 

[Tle = [UTU] 

= [UMa[Tla[Ule: 

= [U]s'[T]e[U]e 
lo que, precisamente, es la fórmula para el cambio de base ya conocida. 


I 


Ejercicios 


1. Sea F un cuerpo y sea f el funcional lineal en F? definido por fixi- X2) = ax, + bN 
Para cada uno de los siguientes operadores T. higase g = T'f y hállese g{x,. Xz). 


(a) T(z, 22) = (z, 0); 
(b) T(2,, 2) = (~a 21); 
(c) Than 22) = (Ti — 22, 21 + 22). 


2. Sea V el espacio vectorial de todas las funciones polinomios sobre el cuerpo de los nú- 
meros reales. Sean « y b dos números reales fijos y sea f el funcional lincal en Y definido por 


b 
10) = f| pt) dz. 
Si D es el operador derivación sobre V, ¿qué es D'f? 


3. Sea V el espacio de las matrices n x n sobre el cuerpo F y sea B una matriz » x n dada. 
Si T es un operador lineal sobre V definido por T(4) = AB — BA y si f es la función traza. 
¿Qué es Tf? 


4. Sea V el espacio vectorial de dimensión finita sobre el cuerpo F y sea T un operador 
lineal sobre V. Sea c un escalar y supóngase que existe un vector no nulo x en F tal gue 
Ta = ca. Demostrar que existe un funcional lineal no nulo f en E tal que T'f = cf. 


5. Sea A una matriz m x n de elementos reales. Demostrar que A =0 s. y solo si 
traza (A'A) = 0. 


¡OD TO E Y e SA aa O. A 
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4. Polinomios 


4.1. Algebras 


y El propósito de este capítulo es establecer algunas de las propiedades 
sicas del álgebra de polinomios sobre un cuerpo. El tratamiento se facilita 
si se introduce primero el concepto de un álgebra lincal sobre un cuerpo 


Definición, Sea F un cuerpo. Un álgebra lineal sobre el cuerpo F es un e. 
pacio vec torial Q sobre F con otra operación, llamada multiplicación de vecto! 
que asocia a cada par de vectores a, B de Q un vector aß en Q llamado e 


de a y B, de tal modo que 1 prodi 


(a) la multiplicación es asociativa, 
alpy) = (aß 
(b) la multiplicación es distributiva con respecto a la adición 
aB += ata y (a+ Bh= n+p 


(c) para todo escalar c de F, 


clap) = (ca)B = alch). 


Si existe un elemento | en Q tal = 

` : que la = al = a para todo a de Q., Q se llama 
sk álgebra lineal con unidad sobre F, y a 1 se le llama la unidad de Q. El álgebra 

se dice conmutativa si af = fa, para todo a y ß de Q. l 


Ejemplo 1, El conjunto de las matrices n x n sobre un cuerpo, con las 
Operaciones corrientes, es un álgebra lineal con unidad; en particular el cuerpo 
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mismo es un álgebra lineal con unidad. Este álgebra no es conmutativa si n > 2. 
[I cuerpo mismo es (evidentemente) conmutativo. 


Ejemplo 2. El espacio de todos los operadores lineales sobre un espacio 
vectorial, con la composición como producto, es un álgebra lineal con uni- 
dad. Es conmutativa si, y solo si, el espacio es unidimensional, 


Es posible que el lector tenga alguna experiencia con el producto escalar 
y el producto vectorial de vectores de R?. De ser así, debe observar que nin- 
guno de estos productos es del tipo descrito en la definición de álgebra lineal. 
El primer producto es un «producto escalar» en el sentido que asocia a cada 
par de vectores un escalar, no siendo por consiguiente del tipo de producto 
que se discute ahora. El producto vectorial asocia un vector a cada par de vec- 
tores de R?; pero ésta no es una multiplicación asociativa. 

En lo que resta de esta sección nos ocuparemos de la construcción de un 
álgebra que es significativamente diferente de las álgebras de los ejemplos an- 
leriores. Sean F un cuerpo y S el conjunto de los enteros no negativos. Por el * 
Ejemplo 3 del Capítulo 2, el conjunto de las funciones de S en F es un espacio 
vectorial sobre F. Se representará este espacio vectorial por F”. Los vectores 
de F” son, por tanto, sucesiones infinitas f = (f fi» Jz» - - -) de escalares f de 
F. Si g = (Zo Zi» £2, - - - ) con g; en F, y a, b escalares de F, af + bg es una su- 
cesión infinita dada por 


(1-1) af + bg = (ajo + bgo, afı + bgn, afa + bga, - - -)- 


Definimos un producto en F”? asociando a cada par de vectores f y g de F”? 
el vector fg dado por 


(4-2) a)n = È So- n=0,1,2,.... 
Así Sa = (Sogo, Jo + figo, foga + figi + Sago - - -) 
y como 


a = È ads = È Soni = Oa 


para n = 0, 1, 2, ..., se sigue que la multiplicación es conmutativa, fg = gf. 
Si A también pertenece a F”, entonces 


LIDA = E Udine 


-3 (55 ita 


1=0 Yj= 


n $ 
= Y Y figiilini 


i=03=0 


n nj 
= 35 Gin: 
0 


j=0 i= 


E Joa = LH 
j=0 


UE > e. 


DAA N 
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para n = 0, 1, 2, ..., de modo que 
(4-3) (f9)h = figh). 


Se deja al lector verificar que la multiplicación definida por (4-2) cumple (| 
y (c) en la definición de un álgebra lineal y que el vector 1 = (1, 0,0, ...) si 
como unidad para F”. Entonces F”, con las operaciones definidas anterio, 
mente, es un álgebra lineal conmutativa con unidad sobre el cuerpo F. 

El vector (0. 1.0,...,0,.. .) juega un papel destacado en lo que sigue y 
representará siempre por x. A lo largo de este capítulo nunca se usará x 
indicar un elemento del cuerpo F. El producto de x por sí mismo n veces 
representará por x” y se hará que x% = 1. Entonces 


z? =(0,0,1,0,...), x = (0,0,0,1,0,...) 


y, en general, para todo entero k > 0, (x*), = 1 y (x*), = 0 para todo ente: 
no negativo n + k. Para concluir esta sección observamos que el conjunto 
formado por 1, x,x?,...,es independiente e infinito. Así que el álgebra F” 
es de dimensión finita. 

El álgebra F” se llama también álgebra de las series formales de poten 
sobre F, El elemento f = Uo fis fa, -..) se suele escribir 


(4-4) T= È fa. 


sugerir nada respecto a convergencia, si es que el lector sabe de qué se trata. 
Usando sucesiones se puede definir rigurosamente un álgebra en que las ope- 


tales como sumas infinitas. 


4.2. El Algebra de los polinomios 


Se está ahora en condiciones de definir un polinomio sobre el cuerpo F. 


Definición. Sea F[x] el subespacio de F”? generado por los vectores 1, x, 


2, ... Un elemento de F[x] se llama polinomio sobre F. 


X 


Como F[x] consta de todas las combinaciones lineales (finitas) de x y sus 
potencias, un vector no nulo f de F” es un polinomio si, y solo si, existe un 
entero n > 0 tal que f, + 0 y tal que J = 0 para todos los enteros k > n; este 
entero (cuando existe) es obviamente único y se llama grado de f. Se represen- 
tará el grado de un polinomio f por grd f, y no se asignará grado a! polinomio 0. 
Si f es un polinomio no nulo de grado n se tiene que 


(4-5) S5 + fiet fat + far, fa %0. 
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Los escalares fo, fi» - . ., f, son llamados a veces los coeficientes de f, y se dirá 
que f es un polinomio con coeficientes en F. Se llamarán polinomios escalares 
a los polinomios de la forma cx” y frecuentemente se escribirá c en vez de cx2. 
Un polinomio no nulo f de grado n tal que f, = 1 se dice que es un polinomio 
mónico. 

El lector observará que los polinomios no son la misma clase de objetos 
que las funciones polinomios sobre F que se han estudiado varias veces. Si 
F tiene un número infinito de elementos, existe un isomorfismo natural entre 
F[x] y cl álgebra de las funciones polinomios sobre F. Ello se verá en la próxi- 
ma sección. Verifiquemos ahora que F[x] es un álgebra. 


Teorema 1. Sean f y g polinomios no nulos sobre F. Entonces 


(i) fg es un polinomio no nulo; 

(ii) grd (fg) = grd f + grd g; 

(iii) fg es un polinomio mónico si ambos, f y g, son polinomios mónicos; 
(iv) fg es un polinomio escalar si, y solo si, ambos f y g son polinomios escalares; 
(si f +g +0, 

grd (f + g) < máx. (grd f, grd g) 
Demostración. Supóngase que f tiene grado m y que g tiene grado n. Si 
k es un entero no negativo, 
mtn+k 


TDminyr = p> 


io 


Figmin+r—i> 


Para que f8m+n+x-i # 0 es necesario que i < my m +n + k -— i< n. Luego 
es necesario que m + k < i < m, lo que implica k = 0 e i = m. Asi, 


(4-6) CDi = fmgn 
. Y 
(4-7) (0) m+n+a = 0, k>0. 


Las afirmaciones (i), (ii), (iii) se desprenden inmediatamente de (4-6) y (4-7), 
mientras que (iv) es una consecuencia de (i) y (ii). Se deja la comprobación de 
(v) al lector. Ẹ 


Corolario 1. El conjunto de todos los polinomios sobre el cuerpo F dado 
dotado de las operaciones (4-1) y (4-2) es un álgebra lineal conmutativa con uni- 
dad sobre F. 


Demostración. Como las operaciones (4-1) y (4-2) son aquellas definidas 
en el álgebra F” y como F[x] es un subespacio de F”, es suficiente demostrar 
que el producto de dos polinomios es también un polinomio. Ello es trivial 
cuando uno de los factores es 0, y en los otros casos se deduce de (i). Pl 


Corolario 2. Supóngase que f,.g y h son polinomios sobre el cuerpo F tales 
que f 40 y fg = fh. Entonces g = h. 


— a 


ESA AA EAS ARSS ASAS. AAA AAA A AA AAA. A Cl. a 
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Demostración. Como fg = fh, fle—h)=0 y f + 0, se sigue inmedia- 
tamente de (i) que g— h=0. I 


Otros hechos más se desprenden fácilmente de la demostración del Teore- 
ma 1, y de algunos de ellos haremos mención. Supóngase 


J= Èja y g= Lor. 
i=0 j=0 


Entonces de (4-7) se tiene 


min fa 
(48) 10 "E (3 o) 


El lector deberá comprobar, para el caso particular f = cx”, g = dx” con 
c, d en F, que (4-8) se reduce a 


(4-9) (cx”)(dx") = cdam+”, 


Ahora, de (4-9) y las leyes distributivas en F[x], se sigue que el producto en 
(4-8) también está dado por 


(4-10) E figi 
+j 


donde la suma se extiende sobre todos los pares de enteros i, j tales qu 
0O<si<myO0<j<n. 


Definición. Sea A un álgebra lineal con unidad sobre el cuerpo F. Se in- 
dicará la unidad de @ por 1 y se conviene que «a? = 1 para todo a de G. Entonces 
a cada polinomio f = Y fx! sobre F y a de Q se asocia un elemento fla) de Q 

i=0 
por la ley y 
fa)= E fol. 
i=0 
Ejemplo 3. Sea C el cuerpo de los números complejos y sea f = x? + 2. 
(a) Si G = C y z pertenece a C, f(z) = 2? + 2, en particular f(2) = 6 y 


1+%_ 
6 — 5) F 
(b) Si G es el álgebra de todas las matrices 2 x 2 sobre C y si 


1 0 
B=[_; 2 


s-alo dla JLo e] 


(c) Si Q es el álgebra de todos los operadores lineales en C? y T es el ele- 
mento de G dado por 


T(cr, Co, 63) = (¿V2 cr, 2, ¿12 05) 


entonces 


> q E A ¿IEPS e 
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entonces /(T) es el operador lineal sobre C? definido por 
FCT) (cr, c2, c3) = (0, 3ca, 0). 


(d) Si G es el álgebra de todos los polinomios sobre C y g = x* + 3i, 
entonces f(g) es el polinomio de Q dado por 


Flg) = —7 + Giant + zè. 


El lector atento habrá observado, en conexión con este último ejemplo, 
que si f es un polinomio sobre cualquier cuerpo y x es el polinomio (0, 1, 0, . . .), 
entonces f = f(x), pero se le aconseja olvidar este hecho. 


Teorema 2. Sea F un cuerpo y Q un álgebra lineal con unidad sobre F. Su- 
póngase que f y g son polinomios sobre F, que a es un elemento de Q y que c per- 
tenece a F. Entonces 


(1) (f + gla) = cfla) + gia); 
(11) Uga) = flaga). 


Demostración. Como (i) es fácil de probar, se demostrará solamente (ii). 
Supóngase que 
m le n s 
J= Dfa y g= Diga. 
i=0 j=0 


Por (4-10), E 
fg = Est 


y luego por (i), 
uego po UN) = Z fait 


= (22o) 


= fogla). I 


Ejercicios 
I. Sea F un subcuerpo de los números complejos y sea A la siguiente matriz 2 x 2 


sobre F 
2 1 
P [tez al 


Para cada uno de los siguientes polinomios f sobre F, calcular f(4). 
(a) f =14— 2 +2; 
(b)f=x%=1; 
(c) f = 2 — 52 +7. 
2. Sea T el operador lineal 7 sobre R? definido por 
T (En To, 23) = (T1, Ta, —2t2 — 23). 


Sca f el polinomio sobre R definido por f = —x* + 2. Hallar f(T). 


ARA TY á¿OÓÉRA A AAA ARA 
D a a 
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3. Sea A una matriz diagonal n x n sobre el cuerpo F, es decir, una matriz para la cui 
Aj = 0 para ¡+ j. Sea f el polinomio sobre F definido por 


f= (2— An) <+- (£ — Am): 
¿Cuál es la matriz JAY? 


4. Si f y g son polinomios independientes sobre el cuerpo F y h es un polinomio no nul 
sobre F. Demostrar que fh y gh son independientes. 


5. Si F es un cuerpo, demostrar que el producto de dos elementos no nulos de F® 
no nulo. 


6. Sea S un conjunto de polinomios no nulos sobre el cuerpo F. Si no hay dos elemen: 
de S que tengan el mismo grado, demostrar que $ es un conjunto independiente de F[x], 


7. Si a y b son elementos de un cuerpo F y a + 0, demostrar que los polinomios 1, ax + 
(ax + bY, (ax + b}, ... forman una base de F[x]. 


8. Si Fes un cuerpo y h es un polinomio sobre F de grado >1, demostrar que la apli 
ción f— f(h) es una transformación lineal inyectiva de F| [x] en F[x]. Demostrar 
esta transformación es un isomorfismo de F[x] sobre F[x] si, y solo si, grd h = 1. 


9. Sea Fun subcuerpo de los números complejos y sean 7, D las transformaciones sol 
F[x] definidas por 


r(3 ciz $ an 
i20 01 +1 
y 
n n. 
DÍ Y cx) = 3 icz. 
¿=0 im 


(a) Demostrar que T es un operador lineal no singular sobre F [x]. Demostrar tambi 
que T no es inversible. 

(b) Demostrar que D es un operador lineal sobre F[x] y determinar su espacio nulo, 

(c) Demostrar que DT = I y que TD 4 I. 

(d) Demostrar que 7[(7/M)g] = (1/UTg) — TÁ Tg) para todo f, g en F[x]. 

(e) Formular y demostrar una ley para D análoga a la dada para T en (d). 

(f) Supóngase que Y es un subespacio no nulo F[x] tal que 7f pertenezca a Y pa 
todo f de V. Demostrar que V no es de dimensión finita. 

(g) Supóngase que V es un subespacio de dimensión finita de F| [x]. Demostrar q 
existe un entero m > 0 tal que D"f = 0 para todo f en V. 


4.3. Interpolación de Lagrange 


En esta sección F es un cuerpo fijo y to, fi» - . -, fa Son n + 1 elementos dis- 
tintos de F. Sea V el subespacio de F[x] que consta de todos los polinomi 
de grado menor o igual a n (junto con el polinomio 0), y sea L; la función de 
V en F definida para f en V por 


LAS) = Fo; 


Por la parte (i) del Teorema 2, todo L; es un funcional lineal sobre V, y una 
de las cosas que interesan es demostrar que el conjunto constituido por los Lo, 
L;, ..., L, es una base de V*, el espacio dual de V. 


0<i<n. 
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Por supuesto, que, para que sea así, es suficiente (en referencia al Teorema 15 
del Capítulo 3) que (Lo, Lı» . . -, La} sea el dual de una base (Po, Pi, -.-, Pa) 
de V. A lo más existe una de.tales bases y si existe está caracterizada por 


(4-11) LAP) = Pát) = ds; 

Los polinomios 

(z — to) +++ (a — tihs — ti) ++: (2 — ta) 
(ls — to) >> (li — tilo — tiz) ++ > (li — ta) 


E E =+) 
de ti — ty 


son de grado n, luego pertenecen a V, y por el Teorema 2 satisfacen (4-11). 
Si f = E c,P,, entonces para todo j, 
li 


Ft) = Z aP (t) = cj- 


(4-12) P: = 


(4-13) 


Como el polinomio 0 tiene la propiedad que 0(£) = 0 para todo 1 en F, se sigue 
de (4-13) que los polinomios Po, P}, ..., P, son linealmente independientes. 
Los polinomios 1, x, ..., x” forman una base de V y, por tanto, la dimensión 
de V es (n + 1). Asi el conjunto independiente (Po, Py, .. . , Pa} tiene que ser 
también una base de V. Con lo que para todo f de V 

n 
(4-14) j= D IPs 

iai 
La expresión (4-14) se llama la fórmula de interpolación de Lagrange. Poniendo 
f=x en (4-14), se tiene 


zi = z MPi 


Ahora bien, del Teorema 7 del Capítulo 2, se sigue que la matriz 


l b 6 to 

2 ” 

(4-15) Mbs a 
Li Bea 


es inversible. La matriz en (4-15) se llama una matriz de Vandermonde; es un 
ejercicio interesante demostrar en forma directa que tal matriz es inversible 
cuando to, fi, -.., f son n + 1 elementos distintos de F. 

Si f es cualquier polinomio sobre F, en el presente tratamiento se represen- 
tará por f” la función polinomio de F en F que aplica todo t de F en f(t). Por 
definición (véase Ejemplo 4, Capítulo 2), toda función polinomio surge de esta 
forma; sin embargo, puede suceder que f” = g` para dos polinomios f y g 
tales que f + g. Afortunadamente, como se verá, esta situación poco placen- 
tera solo sucede en el caso en que F es un cuerpo que tiene un número finito 
de elementos distintos. Para describir en forma precisa la relación entre poli- 
nomios y funciones polinomios, se necesita definir el producto de dos funcio- 


e A NS de 
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nes polinomios. Si f, g son polinomios sobre F, el producto de f” y g” es la 
función f”g” de F en F dada por 


(4-16) (FO = Og), ten F. 
Por la parte (ii) del Teorema 2, (fg)(t) = f(1)g(t), y entonces 
GNA = FOÀ 


para cada 1 en F. Así, f”g” = (fg), y es una función polinomio. Ahora ya 
es inmediato, y se deja al lector, verificar que el espacio vectorial de las funcio- 
nes polinomios sobre F es un álgebra lineal con unidad sobre F si la multipli- 
cación está definida por (4-16). 


Definición. Sea F un cuerpo y sean Q y Q` dos álgebras lineales sobre F. 
Las álgebras Q y A” se dicen isomorfaus si existe una aplicación bivectiva a —> a” 
de Q en Q` tal que 

(a) (ca + df) = cau + df” 

(b) (af) =p 
para todo a, B de Q y todo escalar c, d de F. De la aplicación a—= a se dice que 
es un isomorfismo de G sobre Q`. Un isomorfismo de Q sobre Q` es entonces 
un isomorfismo de espacios vectoriales de Q sobre Q` que tiene, además, la pro- 
piedad (b) de «preservar» productos. 


Ejemplo 4. Sea V un espacio vectorial de dimensión n sobre el cuerpo F. 
Por el Teorema 13 del Capítulo 3 y las observaciones subsecuentes, cada base 
ordenada ( de V determina un isomorfismo T— [7]g del álgebra de los ope- 
radores lineales sobre V sobre el álgebra de las matrices n x n sobre F. Supón- 
gase ahora que U es un operador lineal fijo y que se ha dado un polinomio 


n 
J= 3 cat > 

i=0 

con coeficientes c; en F. Entonces 
NU) = È cU" 
y como T— [T]ę es una aplicación lineal, 
[NU = 2 ci[Ullo. 

Ahora, del hecho adicional que 


[T:Tz]e = [Tel Te 
para todo 7,, T, en L(V, V), se sigue que 
[Utla = ([Ule)', 2<1i<nm. 
Como esta relación es válida también para į = 0, 1 se tiene el resultado 


(4-17) [Ue = $100). 


SRA O O l A ¿-—— BA 
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En otras palabras, si U es un operador lineal sobre V, la matriz de un polinomio 
en U, en una base dada es el mismo polinomio en la matriz de U. 


Teorema 3. Si F es un cuerpo que tiene un número infinito de elementos 
distintos, la aplicación f — f~ es un isomorfismo del álgebra de polinomios sobre 
F, sobre el álgebra de las funciones polinomios sobre F. 


Demostración. Por definición, la aplicación es sobreyectiva y si f, g perte- 
necen a F[x] es evidente que 


(f + dg)” = df” + dy” 
pata todo escalar c y d. Como ya se ha visto que (/g)” = f”g”, se necesita 
solo demostrar que la aplicación es inyectiva. Para ello es suficiente, por la 
linealidad, demostrar que f~ = 0 implica f = 0. Supóngase, entonces, que f 
es un polinomio de grado n, o menor, tal que f” = 0. Sean to, t1,..., imn + 1 
elementos distintos cualesquiera de F. Como f” = 0, f(t¡) = 0 para i= 0, 
l, ..., 7, y es una inmediata consecuencia de (4-14) que f = 0. | 


De los resultados de la siguiente sección obtendremos una demostración 
totalmente diferente de este teorema. 


Ejercicios 
1. Usando la fórmula de interpolación de Lagrange, hallar un polinomio f, con coeficien- 
tes reales, tal que f tenga grado <3 y que f(—1)= —6, f(0) = 2. f(1)= —2, NA) = 6. 


2. Sean a, B, y, ô números reales. Se pregunta, ¿cuándo es posible hallar un polinomio 
f sobre R, de grado no mayor que 2, tal que f(—1)=0, f1) = P. JB) = y y M0) = 0? 
Demostrar que ello solo es posible si, y solo si 

3a +68 — y — 80 = 0. 


3. Sea F el cuerpo de los números reales, 


2000 
_jo200 
A4=l0030 
0001 

p = (z — Dr — 3)(z — 1) 


(a) Demostrar que p(4) = 0. 

(b) Sean P,, Pz, Py los polinomios de Lagrange para 1, = 2, t, = 3, t3 = 1. Calcular 
E,= P(A), i= 1, 2, 3. 

(c) Demostrar que E, + E, + E, = I, E,E¿=0 si i +j, Ef = E. 

(d) Demostrar que A = 2E, + 3E, + Ez. 


4. Sea p= {x — 2Mx — 3){x — 1) y sea T cualquier operador lineal sobre R* tal que 
p(T) = 0. Sean P,, Pz, P, los polinomios de Lagrange del Ejercicio 3 y sea E, = P;(T), 
i = 1,2, 3. Demostrar que 
E + E2 + Es = 1, EE¡=0 si 1%Xj, 
El =E,, y T=2E,+3E; + Es. 
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5. Sea n un entero positivo y F un cuerpo. Supóngase que A es una matriz n x n sobre F y 
P una matriz n x n inversible sobre F. Si f es cualquier polinomio sobre F, demostrar que 


FKPAAP) = P-4(A)P. 


6. Sea F un cuerpo. Se han considerado ciertos funcionales lineales especiales en F[x] 
obtenidos por «evaluación en f»: 


LG) =$. 


Tales funcionales no son solo lineales, sino que también tienen la propiedad de que L(Jg) = 
L(f)L(g). Demostrar que si L es cualquier funcional lineal sobre F[x] tal que 


L(fo) = LL) 
para todo f y g, entonces L = 0, o existe un 1 en F tal que L(f) = f(t) para todo f. 


4.4. Ideales de polinomios 


En esta sección se tratarán aquellos temas que dependen ante todo de la 
estructura multiplicativa del álgebra de los polinomios sobre un cuerpo. 


Lema. Supóngase que f y d son polinomios no nulos sobre un cuerpo F tal 
que grd d < grd f. Entonces existe un polinomio g de F[x] tal que 


f—dg=0 o grd(f— dg) < grd f. 
Demostración. Supóngase que 
m-l 
S= anat 20%,  0n*0 
y que 
n=l 
d=bat D bizi, bn #0. 
Entonces m > n, y 
f- (jea =0 o grad|£ =4 (55)e—.] <grad f. 
Así que se puede tomar g = 5) a, I 


Usando este lema se puede ver ahora que el proceso familiar de división 
de polinomios con coeficientes reales o complejos puede hacerse sobre cual- 
quier cuerpo. 


Teorema 4. Si f, d son polinomios sobre. un cuerpo F y d es diferente de O, 
entonces existen polinomios q, r en F[x] tales que 


O f=dgw+r. 
Gi) o, r=00 grd r < grd d. 


Los polinomios q, r que satisfacen (i) y (ü) son únicos. 


Py; PITA AA 
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Demostración. Si f es 0 o de grd f < grd d, se puede tomar q = 0 y r = f. 
En caso de que f + 0 y grd f > grd d, el lema anterior dice que se puede elegir 
un polinomio g tal que f — dg = 0 o grd (f — dg) < grd f. Si f — dg + 0 y 
grd (f — dg) < grd d, se elige un polinomio h tal que (f — dg) — dh = 0, o 


grd [f — dig + h)] < grd (f — dg). 


Si se sigue este proceso tantas veces como sea necesario se llega a obtener 
polinomios q, r tales que r = 0 o grd r < grd d, y f = dq + r. Ahora supón- 
pase que también se tenga f — dq, + r,, donde r, = Oo grd r, < grd d. Enton- 
tonces dg +r = dq, +r, y diq- qı)=rı—r. Si q— qı +0, entonces 
diq — qı) + 0, y 


grd d + grd (q — qı) = grd (r, — r). 


Pero como el grado de r, — r es menor que el grado de d, esto es imposible 
y q— qı = 0. Luego también r, -r=0. | 


Definición. Sea d un polinomio no nulo sobre el cuerpo F. Si f pertenece 
a F[x], el teorema anterior dice que existe, a lo más, un polinomio q en F[x] tal 
que f = dg. Si tal q existe, se dice que d divide a f, que f es divisible por d, que 
f es un múltiplo de d y que q es el cociente de f por d. Se escribirá, pues, q= f/d. 


Corolario 1. Sea f un polinomio sobre el cuerpo F y sea c un elemento de F. 
Entonces f es divisible por x — c si, y solo si, f(c) = 0. 


Demostración. Por el teorema, f = (x-— c)q + r, donde r es un polinomio 
escalar. Por el Teorema 2, 


F(c) = Ogle) + r(c) = r(e). 
Luego r = 0 si, y solo si, f(c)=0. E 


Definición. Sea F un cuerpo. Un elemento c de F se dice raiz, o un cero, de un 
polinomio dado f sobre F si f(c) = 0. 


Corolario 2. Un polinomio f de grado n sobre un cuerpo F tiene a lo más 
n raices en F. 


Demostración. La tesis es obviamente cierta para los polinomios de gra- 
do 0 y grado 1. Supóngase que es cierta para polinomios de grado n — 1. Si 
a es una raíz de f, f = (x — a)q, donde q tiene grado n — 1. Como fib) = 0 
si, y solo si, a = b o q(b) = 0, se sigue por la hipótesis de inducción que f tiene 
a lo más n raices. |] 


El lector debe observar que la etapa principal en la demostración del Teore- 
ma 3 se desprende inmediatamente de este corolario. 

La derivada formal de un polinomio es de gran utilidad en el estudio de 
las raíces múltiples. La derivada de un polinomio 


J= otar t -o H er” 
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es el polinomio 
F = a t 2er t -e H neat 


También se usa la notación Df = f'. La derivación es lineal, esto es, D es un 
operador lineal sobre F[x]. Se tienen las derivadas formales de orden superior, 
f’ =D?f, f® = D?f, y así sucesivamente. 


Teorema 5 (fórmula de Taylor). Sea F un cuerpo de caracteristica cero, 
c un elemento de F y n un entero positivo. Si f es un polinomio sobre f con grd f <n, 
entonces 


k 
$ 2 GP o- of. 


Demostración. La fórmula de Taylor es una consecuencia del teorema 
del binomio y la linealidad de los operadores D, D?, ..., D". El teorema del 
binomio es fácilmente demostrable por inducción y dice que 


(a +b)” = 2 (x) ambk 
donde Aro 


(o) m! _mím—1) --- (m—k+1) 
k k!(m — k)! 1-2---% 


son los conocidos coeficientes binomiales que dan el número de combinacio- 
nes de m objetos tomados de k en k. Por el teorema del binomio 


a" = [e + (z — c)]" 


= s (o) ea O 


= "4 m (z = 0) + + e- o” 
que es la fórmula de Taylor para el caso f = x”. Si 


f= È ar 


entonces ; 
DIO = Zan(Disr)o) 


Debe observarse que. puesto que los polinomios 1, (x — c), ..., (x — e 
son linealmente independientes (véase Ejercicio 6, Sección 4.2), la fórmula 
de Taylor da el único método para escribir f como combinación de los poli- 
nomios (x — c}, (0 < k < n). 

Aunque no se den mayores detalles, es tal vez de utilidad mencionar aquí 
que, con una apropiada interpretación, la fórmula de Taylor es también válida 
para polinomios sobre cuerpos de característica finita. Si el cuerpo tiene carac- 
terística finita (la suma de un número finito de unidades de F es 0), entonces 
se puede tener que k! = 0 en F, en cuyo caso la división de (D*fX(c) por k! no 
tiene sentido. No obstante, se puede dar sentido a la división de D*f por k!, 
porque cada coeficiente de D*f es un elemento de F multiplicado por un entero 
divisible por k! Si todo esto resultase confuso, se aconseja al lector restringir 
su atención a cuerpos de característica 0 o a subcuerpos de los números com- 
plejos. 

Si c es una raiz del polinomio f, la multiplicidad de la raiz ¢ de f es el mayor 
entero positivo r tal que (x — cY divide a f. 

La multiplicidad de una raíz es evidentemente menor o igual al grado de f. 
Para polinomios sobre cuerpos de característica cero la multiplicidad de la 
raíz e de f está relacionada con el número de derivadas de f que son nulas en c. 


Teorema 6. Sea F un cuerpo de característica cero y f un polinomio sobre 
Econ grd f < n. Entonces el escalar c es una raíz de f de multiplicidad r si, y solo si, 


(DFX) =0,  0O<k<r-=1 
(D'fMc) + 0. 


Demostración. Supóngase que r es la multiplicidad de la raíz c de f. Enton- 
ces existe un polinomio g tal que f = (x — cYg y g(c) + 0. De otro modo, f 
sería divisible por (x — cY +', por el Corolario 1 del Teorema 4. Por la fórmu- 
la de Taylor aplicada a g 


1= 6-0 [3 22 o 6 -o"] 
"3 DD q 


gr” 
m=0 

Como hay solo una manera de escribir f como combinación lineal de las po- 
tencias (x — c} (0 < k < n), se sigue que 


0siO0O<k<r-—1 
(DN) _ 
k! Dgle) 


(k — r)! 


Por tanto, D*f(c)= 0 para O<k<x-— 1, y D'fíc) = g(c) + 0. Recípro- 
procamente, si estas condiciones se cumplen, se sigue de inmediato, por la fórmu- 
la de Taylor, que existe un polinomio g tal que f = (x — cYg y g(c) + 0. Supón- 
gase ahora que r no sea el mayor entero positivo tal que (x — cY divida a f. 
Entonces existe un polinomio h tal que f = (x — e*'h. Pero ello implica 


sir<k<mnm. 


AO 


—_— oy 
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g = (x — c)h, por el Corolario 2 del Teorema 1; luego gtc) = 0. que es u 
contradicción. | 


Definición. Sea F un cuerpo. Un ideal en F[x] es un subespacio M de F[x] 
tal que fg pertenece a M siempre que f esté en F| [x], y g en M. 


Ejemplo 5. Si F es un cuerpo y d es un polinomio sobre F, el conjunto 
M = dF[x], de todos los múltiplos df de d por f arbitrario en F[x], es un ideal. 
En efecto, M no es vacio, ya que contiene a d. Si f, g pertenecen a F[x] y c es 
un escalar, entonces 


cldf) — dg = d(ef — g) 


pertenece à M, con lo que M es un subespacio. Finalmente, también M con- 
tiene a (df)g = d(fg). El ideal M se llama el ideal principal generado por d. 


Ejemplo 6. Sean d;, . . . , d, un número finito de polinomios sobre F. Enton- 
ces la suma M de todos los subespacios d;F[x] es un subespacio y es también 
un ideal. Para ello supóngase que p pertenezca a M. Entonces existen poli- 
nomios fi, .... f, en F[x] tal que p=d,f,+->--+d,f,. Si g es un polinomio 
arbitrario sobre F, entonces 


pg = di(fig) + --- + dalf.g) 


de modo que pq también pertenece a M. Así M es un ideal, y se dirá que M es 
el ideal generado por los polinomios d,, ..., d,. 


Ejemplo 7. Sea F un subcuerpo de los números reales y considérese el 
ideal 
M = (x + 2)F[x] + (2? + 82 + 16)F[2]. 
Se afirma que M = F[x]. En efecto, M contiene a 
z? + 8r + 16 — x(x + 2) = 6r + 16 


y, por tanto, M contiene a 6x + 6(x + 2) = 4. Luego el polinomio escalar 1 
pertenece a M, como también todos sus múltiplos. 


Teorema 7. Si F es un cuerpo y M es un ideal no nulo de F| [x], existe un 
único polinomio mónico d en F[x] tal que M es el ideal principal generado por d. 


Demostración. Por suposición, M contiene un polinomio no nulo; entre 
todos los polinomios no nulos en M existe un polinomio d de menor grado. 
Podemos admitir que d es un polinomio mónico, pues si no se puede multipli- 
car d por un escalar para hacerlo mónico. Si f pertenece a M, el Teorema 4 
dice que f = dq + r, donde r = 0 o grd r < grd d. Como d está en M, dq y 
f — dq = r también pertenecen a M. Como d es un elemento de M de grado 
mínimo, no se puede tener grd r < grd d, con lo que r = 0. Asi M = dF] [x]. 
Si g es otro polinomio mónico tal que M = gF| [x], entonces existen polinomios 
no nulos p, q tales que d = gp y g = dq. Con lo que d = dpq, y 


grd d = grd d + grd p - grd q. 


E  <€é€<CCGqeo.nn_— 
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Luego grd p = grd q = 0, y como d, g son mónicos, p = q =1.Asíd=g. | 


Es importante observar que en la demostración recién dada se ha usado 
el caso especial de un hecho más general y útil; a saber, si p es un polinomio 
no nulo en un ideal M y si f es un polinomio en M que no es divisible por p, 
entonces f = pq + r, donde el «resto» r que pertenece a M, es distinto de 0, 
y tiene grado menor que p. Ya se había hecho uso de esta situación en el Ejem- 
plo 7 para ver que el polinomio escalar 1 es el generador mónico del ideal con- 
siderado allí. En principio, siempre es posible encontrar el polinomio mónico 
que genera un ideal dado no nulo. En efecto, se puede obtener, al final, un poli- 
nomio en el ideal de grado minimal por un número finito de divisiones sucesivas. 


Corolario. Si p,, ..., Pa son polinomios sobre el cuerpo F. no todos nulos, 
existe un único polinomio mónico d en F[x] tal que 

(a) d pertenece al ideal generado por p,, ... 

(b) d divide a cada uno de los polinomios p,. 
Todo polinomio que satisface (a) y (b) necesariamente satisface a 

(c) d es divisible por todo polinomio que divide cada uno de los polinomios 
Mus «<a Di 


s Pn; 


Demostración. Sea d el generador mónico del ideal 

pF[zx] + --- +prF[z]. 
Cada elemento de este ideal es divisible por d; así, pues, cada uno de los poli- 
nomios p; es divisible por d. Supóngase ahora que f es un polinomio que divide 
a cada uno de los polinomios p,, . . . , Pa- Entonces existen polinomios g4, ....., 8n 
tales que p; = fg 1 <i <n. Asimismo, como d pertenece al ideal 


pFlx] + --- + pFiz], 
-> qn en F[x] tal que 
d = pqi + +++ + Prga 


existen polinomios q,, .. 


Con lo que 
d = flag + +- + gnaga]. 


Se ha mostrado que d es un polinomio mónico que satisface a (a), (b) y (c). Si 
d' es cualquier polinomio que satisface (a) y (b) se sigue, de (a) y de la definición 
de d, que d' es un múltiplo escalar de d y que satisface igualmente a (c). Final- 
mente, en el caso que d' sea un polinomio mónico, se tiene d' =d. PP 


Definición. Si p,, .. 
el generador d del ideal 


-> Pn Son polinomios sobre el cuerpo F, no todos nulos, 


PEL +>:-++psF[x] 


se llama el máximo común divisor (m.c.d.) de p,, ..., pa. Esta terminología está 
justificada por el corolario anterior. Se dice que los polinomios p,, > + p, Pn SOR 
primos relativos si su máximo común divisor es 1, o en forma equivale., si el 
ideal que ellos generan es todo F[x]. 


—n_—=—>” 
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Ejemplo 8. Sea C el cuerpo de los números complejos. Entonces 


(a) m.c.d. (x +2, x? + 8x + 16) = 1 (véase Ejemplo 7). 
(b) m.c.d. ((x — 2 (x + i), (x + 2x0? + 1)) = (x — 2Mx + i). En efec- 
to, el ideal 


(z — 2x + )F[z] + (2 — 2)(2? + DF[z] 
contiene a 
(z — Ye + i) — (z — 2)? + 1) = (1 — 2 + DG — 2). 
Luego contiene a (x — 2)(x + i), que es mónico y divide a 
z- e+) y (1-2(*+1). 


Ejemplo 9. Sea F el cuerpo de los números racionales y en F[x] sea M el 
ideal generado por 


(@ — DU +2), 
Entonces M contiene a 


Mx + 2P[@ — 1) — (2 — 3)] = (2 + 2)? 


(z + 27 — 3), y (æ — 3). 


y como 
(1 +2)? = (z — 3x2 +7) — 17 


M contiene al polinomio escalar 1. Así M = F[x] y los polinomios 
@ -= 1+2}, (æ +2){z-— 3), y (2 — 3) 


son primos relativos. 


Ejercicios 


1. Sea Q el cuerpo de los números racionales. Determinar cuáles de los siguientes subcon- 
juntos de O[x] son ideales. Cuando el conjunto es un ideal, encontrar su generador mónico. 
(a) todos los f de grado par; 
(b) todos los f de grado >5; 
(c) todos los f tales que f(0) = 0; 
(d) todos los f tales que f(2) = f(4) = 0; 
(e) todos los f en la imagen del operador lineal 7 definido por 


giti, 


E Eon) - 3 A 1 


2. Encontrar el m.c.d. de cada uno de los siguientes pares de polinomios 


(a) 225 — z? — 3a2— 6x + 4, zt + a? — T? — 22 — 2; 
(b) 3x4 + 8r? — 3, z? + 22? + 32 + 6: 
(c) zt — 22? — 2r? — 2z — 3, 4 + 6z? + 7z + 1. 


3. Sea A una matriz n x n sobre el cuerpo F. Demostrar que el conjunto de todos los poli- 
nomios f en F[x], tales que f(4) = 0, es un ideal. 
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4. Seca F un subcuerpo de los números complejos y sea 
“Ome —2 
AT [o al 
Encontrar el generador mónico de ideal de todos los polinomios f en F[x] tales que 
NA) = 
5. PSea F un cuerpo. Demostrar que la intersección de cualquier número de ideales en 
FLx] es un ideal. 


6. Sea F un cuerpo. Demostrar que el ideal generado por un número finito de polinomios 
fis -- -> fa en F[x] es la intersección de todos los ideales que contienen a f}, ..., fp 


7. Sea K un subcuerpo de un cuerpo F y supóngase que f, g son polinomios en K[x]. Sea 
Mx el ideal generado por f y g en K[x] y Mp el ideal que ellos generan en F[x]. Demos- 
trar que Mx y Mp tienen el mismo generador mónico. 


4.5. Factorización prima de un polinomio 


En esta sección se demostrará que cada polinomio sobre un cuerpo F puede 
escribirse como producto de polinomios «primos». Esta factorización propor- 
ciona un instrumento eficaz para encontrar el máximo común divisor de un 
número finito de polinomios, y en particular suministra un recurso efectivo 
para decidir cuándo los polinomios son primos relativos. 


Definición. Sea F un cuerpo. Un polinomio f de F[x] se dice reducible sobre 
F si existen polinomios g, h en F[x] de grado >1 tales que f = gh, y si no, se dice 
que es irreducible sobre F. Un polinomio no escalar irreducible sobre F se llama 
polinomio primo sobre F y a veces se dice solamente que es primo en F[x]. 


Ejemplo 10. El polinomio x? + 1 es reducible sobre el cuerpo C de los nú- 
meros complejos. En efecto, 
z? +1 = (z +i)(z-— i) 


y los polinomios x + i, x — i pertenecen a C[x]. Por otra parte, x? + 1 es 
irreducible sobre el cuerpo R de los números reales. Pues si 


z? +1 = (ax + b)(a'x + b’) 
con a, a”, b, b' en R, entonces 
ag =1, ab + bg = 0, bb' = 1. 
Estas relaciones implican que a? + b? = 0, lo que es imposible con números 


reales 4 y b, a menos que a = b = 0. 


Teorema 8. Sean p, f y g polinomios sobre el cuerpo F. Supóngase que p 
es un polinomio primo y que p divide al producto fg. Entonces p divide a f, o p di- 
ride a g. 


Demostración. No se pierde generalidad si se supone que p es un polinomio 
primo mónico. El hecho de ser p primo simplemente dice que los únicos divi- 
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sores mónicos de p son 1 y p. Sea d el m.c.d. de f y p. Entonces, d = 1 o d = 
ya que d es un polinomio mónico que divide a p. Si d = p. entonces p divi 
a f, con lo que se habrá demostrado el teorema. Supóngase entonces que d = 
es decir, supóngase que f y p son primos relativos. Se demostrará que p divi 
a g. Como (f, p) = 1, existen polinomios fo y po tales que 1 = fof + pop. M 
tiplicando por g, se tiene 


g = fofg + pg 
= (fg) fo + p(pog). 


Como p divide a /g, divide también a (fg)/, y. ciertamente. p divide p(p, 
Con lo que p divide a g. f 


Corolario. Si p es un primo y divide a un producto fi>- f,. entonces p 
vide a uno de los polinomios fi, .... f- 


* Demostración. La demostración es por inducción. Cuando n = 2, la afir 
ción no es más ue el Teorema 6. Supóngase que se ha demostrado el corol 
para n = k y que p divide al producto fi. .... f+ı de ciertos (k + 1) pol 
nomios. Como p divide a (/, *** f£iMi=1. p divide a f.,,, O p divide a fi +- 
Por la hipótesis inductiva, si p divide a f, -** f. entonces p divide a f, pa 
algún j, 1 < j < k. Con lo que se ve que en cualquier caso p debe dividir al 
fi1Sj<k+1 i 


Teorema 9. Si F es un cuerpo, un polinomio mónico no escalar en F[. 
puede descomponerse en producto de primos mónicos en F[x)] de una ma 
única, salro en lo que respecta al orden. 


Demostración. Supóngase que f sea un polinomio mónico no escalar 
bre F. Como los polinomios de grado uno son irreducibles. nada hay que dem 
trar si grd f = 1. Supóngase que f tiene grado n > 1. Por inducción se supo! 
que el teorema es válido para todo polinomio mónico no escalar de grado meni 
que n. Si f es irreducible está ya factorizado como un producto de primos 
nicos, v en caso contrario f = gh, donde g y h son polinomios mónicos 
escalares de grado menor que n. Con lo que g y h pueden ser factorizados 
producto de primos mónicos en F[x] y. por tanto. también /. Ahora supó 
gase que 


f=- Pm =a 
donde py, . > >, Pm Y qi» + - + + Gn SON primos mónicos de F[x]. Entonces p„ divi 
al producto q, * * - q,. Por el corolario anterior. p,, debe dividir á algún q;. C 


di Y Pm son ambos primos mónicos, ello quiere decir que 


(4-16) Qi = Pm 
Por (4-16) se ve que m =n =] sim= l o n= |. En efecto, 


grad f = Z gradp: = 2 gradg;. 
i= y~ 


En este caso no hay más que demostrar, así que se puede suponer que m > 1 
y n > 1, Reordenando los q se puede suponer entonces que pm = q, y que 


P1*** Pm-1Pm = Qi *** Qn—1Pm- 
Ahora por el Corolario 2 del Teorema 1, se sigue que 
Pi *** Pma = Q*** Gn 


Como el polinomio p; ***P,-1 tiene grado menor que n, nuestra hipótesis 
inductiva es válida y muestra que la sucesión q,, . . ., q,-, es a lo más un reor- 
denamiento de la sucesión p,, ..., Pm-1- Esto, junto con (4-16), muestra que 
la factorización de f como producto de primos mónicos es única, salvo en lo 
que respecta al orden de los factores. $ 


En la antedicha factorización de un polinomio no escalar f dado, algunos 
de los factores mónicos pueden estar repetidos. Si p,, p2» - - -, Pp, Son los primos 
mónicos distintos que aparecen en esta factorización de f, entonces 


(4-17) S = pip? >: pr, 

mendo el exponente n; el número de veces que el primo p; aparece en la factoriza- 
ción. Esta descomposición es también, obviamente, única, y se llama la descom- 
posición prima de f. Es de fácil verificación que cada divisor mónico de f tiene 
la forma 


(4-18) PEP pr, 0<m;¡Sn; 


De (4-18) se sigue con que el m.c.d. de un número finito de polinomios mónicos 
no escalares f}, ..., f, se obtiene por combinación de todos aquellos primos 
Ímónicos que aparecen simultáneamente en la factorización de f,,..., f. El 
exponente con que debe tomarse cada primo es el mayor al que la correspon- 
diente potencia prima es factor de cada f;. Si ninguna potencia prima (no trivial) 
es factor de cada fi, los polinomios son primos relativos. 


Ejemplo 11. Supóngase que F es un cuerpo y sean a, b, c elementos dis- 
tintos de F. Entonces los polinomios x — a, x — b, x — c son primos mónicos 
distintos en F[x]. Si m, n y s son enteros positivos, (x — c} es el m.c.d. de los 
polinomios 


(2—Dx—cr* y 
mientras que los tres polinomios 
(2 — bPa — o)", 


son primos relativos. 


(2 — ajr(a — o) 


(z — ajr(a — e)”, (z — a)r(x — b)” 


Teorema 10. Sea f un polinomio mónico no escalar sobre el cuerpo F y sea 
f=pe-- pr 
la factorización prima de f. Para todo j, 1 < j < k, sea 


h= Sl = YH 


e iaa 
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Entonces fı, ..., fy Son primos relativos. 


Demostración. Se deja esta demostración (muy fácil) para el lector. Se 
ha enunciado en detalle este teorema, porque se hará referencia a él más ade- 
lante. | 


Teorema 11. Sea f un polinomio sobre el cuerpo F con derivada f'. Enton- 
ces f es un producto de polinomios irreducibles distintos sobre F si, y solo si, f y 
f' son primos relativos. 


Demostración. Supóngase que en la factorización prima de f sobre el 
cuerpo F algún polinomio primo p (no escalar) está repetido. Entonces f = p?h 
para algún h en F[x]. Entonces 


f' = PR + 2pp'h 
y p es también un divisor de f’. Luego f y f' no son primos relativos. 


Supóngase ahora que f = p,-** Ph donde p,, ..., p son polinomios 
irreducibles no escalares distintos sobre F. Sea f; = f/p; Entonces 


F = pifi + pfe + --- + Dif. 


Sea p un polinomio primo que divide a f y a f’. Entonces p = p, para algún i. 
Ahora como p; divide a f; para j + i, y como p; también divide a 


k 
f= 2 Pfi 
j=1 


se ve que p; debe dividir p;f;. Por tanto, p; divide a f; o a pj. Pero p; no divide 
a fi, pues los p,, . . . , p sOn distintos. Así p; divide a p;. Ello no es posible, pues 
pi tiene un grado menor que el grado de p;. Concluimos que ningún primo di- 
vide a f y a f', o que f y f' son primos relativos. Ẹ 


Definición. El cuerpo F se llama algebraicamente cerrado si todo polinomio 
primo sobre F tiene grado 1. 


Para decir que F es algebraicamente cerrado, todo polinomio mónico irredu- 
cible no escalar sobre F debe ser de la forma (x — c). Ya hemos observado 
«¡ue todo polinomio de éstos es irreducible para cualquier F. En consecuencia, 
una definición equivalente de un cuerpo algebraicamente cerrado es la de cuer- 
po F tal que cada polinomio no escalar f en F[x] puede ser expresado en la 
forma 

f = ca — a)" --> (£ — ca)" 
donde c es un escalar, c,, . . . , c son elementos distintos de F, y n,, ..., ny son 
enteros positivos. Otra formulación es que si f es un polinomio no escalar sobre 
F, entonces existe un elemento c en F tal que f(c) = 0. 

El cuerpo R de los números reales no es algebraicamente cerrado, pues el 
polinomio (x? + 1) es irreducible sobre R, pero no es de grado 1, o porque 
no existe número real c tal que c? + 1 = 0. El llamado teorema fundamental 
del álgebra dice que el cuerpo C de los números complejos es algebraicamente 
cerrado. No se demostrará este teorema; sin embargo, se lo usará más adelante 
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en este libro. La demostración se omite, en parte, por limitación de espacio 
y, en parte, porque la demostración depende de una propiedad «no algebraica» 
del sistema de los números reales. Para una posible demostración, el lector 
interesado puede consultar el libro de Schreier y Sperner en la bibliografía. 

El teorema fundamental del álgebra también explica cuáles son las posibi- 
lidades de factorización prima de un polinomio con coeficientes reales. Si f es 
un polinomio con coeficientes reales y c es una raíz compleja de f, entonces la 
compleja conjugada č es también una raíz de f. Por tanto, aquellas raíces com- 
plejas que no son reales deben aparecer en pares conjugados y el conjunto en- 
tero de raíces tiene la forma (f,, ..., ty» Cis Cp - - -> Cy, E,), donde ti, ..., ty 
son reales y C,, ..., €, son números complejos no reales. Con lo que f se des- 
compone en la forma 


f = e(z — ti) -+ - (2— Jm `- Pr 
donde p; es el polinomio cuadrático 
Ppi = (a — ci)(x — 7;). 
Estos polinomios p; tienen coeficientes reales. Concluimos que todo polinomio 
irreducible sobre el cuerpo de los números reales tiene grado 1 o 2. Todo po- 


linomio sobre R es el producto de ciertos factores lineales obtenidos de las 
raíces reales de f y ciertos polinomios cuadráticos irreducibles. 


Ejercicios 


1. Sea p un polinomio mónico sobre el cuerpo F y sean f y g polinomios primos relativos 
sobre F. Demostrar que el m.c.d. de pf y pg es p. 


2. Suponiendo demostrado el teorema fundamental del álgebra, demostrar lo siguiente. 
Si f y g son polinomios sobre el cuerpo de los complejos. entonces el m.c.d. (/, g) = 1 si, 
y solo si, f y g no tienen raíces en común. 


3. Sea D el operador de la derivación en el espacio de los polinomios sobre el cuerpo de 
los números complejos. Sea f un polinomio mónico sobre el cuerpo de los números com- 
plejos. Demostrar que 


f= (2-0) --- (£ —cx) 


donde c}, . . . , € son números complejos distintos si, y solo si, f y Df son primos relativos. 
En otras palabras, f no tiene raíces repetidas sino si, y solo si, f y Df no tienen raíces co- 
munes. (Supóngase el teorema fundamental del álgebra.) 


4. Demostrar la siguiente generalización de la fórmula de Taylor. Sean f, g y h polinomios 
sobre un subcuerpo de los números complejos, con grd f < n. Entonces 


IO = E Ie06— W. 
k=0k! 


(Aqui f(g) representa «f de g».) 

Para el resto de los ejercicios se necesita la siguiente definición. Si f, g y p son polino- 
mios sobre el cuerpo F con p + 0, se dice que f es congruente con g módulo p si (f — g) es 
divisible por p. Si f es congruente con g módulo p, se escribe 


f = g mód p. 
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5. Demostrar que para todo polinomio no nulo p, la congruencia módulo p es una 
lación de equivalencia. Es decir: 

(a) Es reflexiva; f = f mód p. 

(b) Es simétrica; si f = g mód p, entonces g = f mód p. 

(c) Es transitiva; si f = g mód p y g = h mód p, entonces f = h mód p. 
6. Supóngase que f = g mód p y fı = gı mód p. 

(a) Demostrar que f + f, =g + 8, mód p. 

(b) Demostrar que ff, = gg, mód p. 


5. Determinantes 


7. Usando el Ejercicio 7, demostrar lo que sigue. Si f, g, h y p son polinomios sobre 
cuerpo F y p + 0 y si f = g mód p, entonces h(f) = h(g) mód p. 
8. Si p es un polinomio irreducible y fg = 0 mód p, demostrar que f = 0 mód p 
g = 0 mód p. Dar un ejemplo que muestre que esto es falso si p no es irreducible. 


5.1. Anillos conmutativos 


En este capítulo demostraremos lo más esencial sobre determinantes de 
matrices cuadradas. Haremos esto no solo para matrices sobre un cuerpo, 
sino también para matrices con elementos que son «escalares» de un tipo más 
general. Hay dos razones para esta generalidad. Primera, en algunos puntos 
del capítulo siguiente tendremos que usar determinantes de matrices con poli- 
nomios como elementos. Segunda, en el tratamiento de los determinantes que 
presentaremos no interviene el axioma de los cuerpos que garantiza un inverso 
multiplicativo para cada elemento no nulo. Por estas razones es apropiado 
desarrollar la teoría de los determinantes de las matrices cuyos elementos per- 
tenecen a un anillo conmutativo con unidad. 


Definición. Un anillo es un conjunto K, junto con dos operaciones 
(x, y)—>x +y y (x, y)>xy que satisfacen: 

(a) K es un grupo conmutativo para la operación (x, y}— x + y (K es gru- 
po aditivo conmutativo); 

(b) (xy)z = x(yz) (la multiplicación es asociativa); 

(c) x(x + z) = xy + xz; (y + z)x = yx + zx (se cumplen las dos leyes 
distributivas). 

Si xy = yx para todo x e y de K, se dice que el anillo es conmutativo. Si existe 
un elemento 1 en K tal que 1x = xl = x para todo x, se dice que K es un anillo 
con unidad, y 1 es la unidad de K. 


Se trata aquí de anillos conmutativos con unidad. Tales anillos pueden 
ser descritos brevemente como un conjunto K, junto con dos operaciones que 


139 


A DA MAA AAA A AAA. 


HU http://libreria-universitaria.blogspot.com Algebra li 


cumplen todos los axiomas de cuerpo dados en el Capítulo 1, excepto posi- 
blemente el axioma (8) y la condición 1 +0. Así, un cuerpo es un anillo con- 
mutativo con unidad distinta de cero en que a cada x distinto de O (cero) le 
corresponde un elemento x”* tal que xx”! = 1. El conjunto de los enteros, 
con las operaciones corrientes, es un anillo conmutativo con unidad que no 
es un Cuerpo. Otro anillo conmutativo con unidad es el conjunto de todos los 
polinomios sobre un cuerpo, junto con la adición y multiplicación que se han 
definido para los polinomios. 

Si K es un anillo conmutativo con unidad, se define una matriz m x n sobre 
K como una función A del conjunto de los pares (i, j) de enteros, 1 < i < m, 
1 <j<n, en K. Como es usual, se representará una tal matriz por una dis- 
posición rectangular que tiene m filas y n columnas. La suma y el producto 
de matrices sobre K se definen igual que para las matrices sobre un cuerpo 


(A + B); = As + By 
(AB); = Z AaBs; 


estando definida la suma cuando A y B tienen el mismo número de filas y el 
mismo número de columnas, y el producto cuando el número de columnas 
de A es igual al número de filas de B. Las propiedades algebraicas básicas de 
estas operaciones son también válidas. Por ejemplo, 


A(B + C) = AB + AC, (AB)C = A(BO), etc. 


Como en el caso de los cuerpos, nos referiremos a los elementos de K como 
escalares. Podemos definir entonces combinaciones lineales de las filas o co- 
lumnas de la matriz como ya se hizo antes. En general, todo lo que previamente 
se hizo para las matrices sobre un cuerpo es válido para matrices sobre K, ex- 
cluyendo aquellos resultados que dependen de'la posibilidad de «dividir» en K. 


5.2. Funciones determinantes 


Sea 'K un anillo conmutativo con unidad. Vamos a asignar a cada matriz 
n x n (cuadrada) sobre K un escalar (elemento de K) llamado determinante 
de la matriz. Es posible definir el determinante de una matriz cuadrada A es- 
cribiendo simplemente una fórmula para este determinante en términos de los 
elementos de A. Se puede entonces deducir las diversas propiedades de los de- 
terminantes partiendo de esta fórmula. Sin embargo, tal fórmula es bastante 
complicada y, para ganar algunas ventajas técnicas, se procederá como sigue. 
Se definirá una «función determinante» en K”*" como una función que asigna 
a cada matriz n x n un escalar sobre K, función que tiene estas propiedades 
especiales: es lineal como función de cada una de las filas de la matriz; su valor 
es 0 sobre toda matriz que tenga dos filas iguales y su valor sobre la matriz iden- 
tidad n x n es 1. Se demostrará que tal función existe, y que es única, es decir, 
que existe exactamente una función así. Cuando demostremos la unicidad, 
obtendremos una fórmula explícita para el determinante junto con muchas 
de sus propiedades. 
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Esta sección se dedicará a la definición de la «función determinante» y a 
la demostración de que existe al menos una función semejante. 


Definición. Sea K un anillo conmutativo con unidad, n un entero positivo 
y sea D una función que asigna a cada matriz n x n sobre K un escalar* D(A) 
en K. Se dice que D es n-lineal si para cada i, 1 < i < n, D es una función lineal 
de la ¡ésima fila cuando las otras (n — 1) filas se dejan fijas. 


Esta definición requiere cierta explicación. Si D es una función de K"*” 
en K, y si dy, ..., 0, son las filas de la matriz A, se puede escribir también 
D(A) = Dla, . . . , an) 


esto es, se puede también considerar D como la función de las filas de A. La 
afirmación de que D es n-lineal quiere decir entonces que 
(5-1) Dlan, . . ., cai + 0%... an) = Dlan... 0. - +1) 

+ D(01,...,%t.. . y An). 


Si se fijan todas las filas, excepto la fila i, y se considera D como función de la 
fila í, es a veces conveniente escribir D(a,) por D(A). Así (5-1) puede abreviar- 
se como 


Díca; + a) = cD(as) + Dla) 


siempre que quede claro su significado. 


Ejemplo 1. Sean kı, ..., k, enteros positivos, 1 < k; < n, y sea a un 
elemento de K. Para toda matriz nx n, A, sobre K, se define 
(5-2) D(A) = aA(1, kı) --- A(n, kn). 


Entonces la función D definida por (5-2) es n-lineal. En efecto, si se conside- 
ra D como función de la fila į, dejando fijas las otras, se puede escribir 


D(a) = A(i, k:)b 
donde b es un elemento fijo de K. Sea œ; = (41, - --» Ain). Entonces se tiene 


[cA(i, k) + A’(i, k:)]b 
cD(ai) + Dlo). 


D(ca; + az) 


Con lo que D es una función lineal de cada una de las filas de A. 
Una función n-lineal particular de este tipo es 


D(A) = Anda `+- Ann 


Es decir, el «producto de los elementos de la diagonal» es una función n-lineal 
sobre K”*”. 


Ejemplo 2. Se definen todas las funciones 2-lincales sobre las matrices 


O A. EA AAA AA 
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2 x 2 sobre K. Sea D tal función. Si se representan las filas de la matriz 2 x 2 
por €,, €, se tiene 


D(A) = D(Ane + Ane, Åna + Ane). 
Utilizando que D es 2-lineal, por (5-1), se tiene 


D(A) = AnDla, Anea + Aseo) + ADe, Ana + Ane) 
= AnAaD(a, &) + AnAzD(a, €) 
+ AnAaD(es e) + ArnAnD(es €). 
Con lo que D está completamente determinado por los cuatro escalares 
Dí, e),  Díleme) Dle, e), y D(es, €2). 


El lector fácilmente podrá verificar lo que sigue. Si a, b, c, d son cuatro esca- 
lares cualesquiera de K y si se define 


D(A) = Anna + AnÁdmb + AnÁnc + Anâzd 
entonces D es una función 2-lineal de las matrices 2 x 2 sobre K y 


Dla, &) = a, D(a, e) = b 
Díez, €) =C, D(e, €2) =d. 


Lema. Una combinación lineal de funciones n-lineales es n-lineal. 


; Demostración. Basta demostrar que una combinación lineal de dos fun- 
ciones n-lineales es n-lineal. Sean D y E funciones n-lineales. Si a y b pertene- 
cen a K, la combinación lineal aD + bE está definida por 


(aD + bE)(A) = aD(A) + bE(A). 
Luego si fijamos todas las filas, excepto la fila i, 


(aD + dE)(ca; + œ) = aD(ca; + œ) + bE(cai + as) 

acD(a;) + aD(a1) + beElas) + bE(os) 
c(aD + bE)(a;) + (aD + bE)(œ). i 
Si K es un cuerpo y V es el conjunto de las matrices n x n, el lema anterior 


dice lo siguiente: El conjunto de las funciones n-lineales en Y es un subespacio 
del espacio de todas las funciones de V en K. 


nil 


Ejemplo 3. Sea D la función definida sobre las matrices 2 x 2 sobre K por 
(5-3) D(A) = An4z — AnAnz. 


Ahora bien, D es la suma de dos funciones del tipo descrito en el Ejemplo 1: 
D= D, + D: 

D(A) = Anda 
D(A) = —AnAn. 
Por el lema anterior, D es una función 2-lineal. El lector que haya tenido alguna 
experiencia con los determinantes, no se sorprenderá de este resultado, ya que 


A, AS A ANNA ci AA E A A. cn 
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reconocerá en (5-3) la definición corriente del determinante de la matriz 2 x 2. 
Claro que la función D que se ha definido no es una función 2-lincal típica, Tiene 
varias propiedades especiales. Anotemos algunas de ellas. Primero, si 7 es la 
matriz identidad 2 x 2, entonces D(1) = 1, es decir, D(€,, €,) = 1. Segundo, 
si dos filas de A son iguales, entonces 


D(A) = AnAn — ArAn = 0. 


Tercero, si A' es la matriz que se obtiene de la matriz 2 x 2, A, intercambiando 
filas, entonces D(4') = — D(A); en efecto, 


D(A’) = AiAi — AiAi 
= AyÁn — ArÁn 
—D(A). 


Definición. Sea D una función n-lineal. Se dice que D es alternada si se 
cumplen las siguientes dos condiciones: 


(a) D(A) = 0 cuando dos filas de A son iguales. 
(b) Si A' es una matriz que se obtiene intercambiando dos filas de A, en- 
tonces D(A’) = — DIA). 


Demostraremos más adelante que toda función n-lincal D que cumple (a), 
automáticamente cumple (b). Hemos puesto las dos condiciones en la defini- 
ción n-lineal alternada por razones de conveniencia. El lector probablemente 
observará que si D satisface (b) y A es una matriz con dos filas iguales, entonces 
D(A) = — D(A). Es tentador concluir que D satisface también la condición (a). 
Esto es cierto, por ejemplo, si K es un cuerpo en el que 1 + 1 +Æ 0, pero en ge- 
neral (a) no es consecuencia de (b). 


Definición. Sea K un anillo conmutativo con unidad y sea n un entero posi- 
tivo. Supóngase que D es una función de matrices n x n sobre K en K. Decimos 
que D es una función determinante si D es n-lineal, alternada, y si DI) = 1. 


Como dijimos antes, mostraremos finalmente que existe exactamente una 
función determinante sobre matrices n x n sobre K. Ello se ve fácilmente para 
las matrices 1 x 1, A = [a], sobre K. La función D dada por D(A) = a es una 
función determinante y, evidentemente, es la única función determinante de 
las matrices 1 x 1. Estamos, pues, en condiciones de considerar el caso para 
n = 2. La función 


D(A) = Arán — AnÁn 
es una función determinante, como se vio en el Ejemplo 3. Además, la fórmula 


encontrada en el Ejemplo 2 muestra que D es la única función determinante 
sobre las matrices 2 x 2. En efecto, se vio que para cualquier función 2-lineal D 


DÍA) = AnånDla, a) + AndrDla, €2) 
+ AyArDles, a) + ArArmDle, €2)- 


PU II 


A. A A A AA. A AA A A 
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Si D es alternada, entonces 


Dla, €) = Díez, e) = 0 


Dle e) = —Dla, ee) = —D(). 
Si D satisface también D(I) = 1, entonces 
D(A) = AnA» — Arnås. 


Ejemplo 4. Sea F un cuerpo y sea D cualquier función 3-lineal y alternada 
de las matrices 3 x 3 sobre el anillo de polinomios F[x]. 


Sea 
r A hi a 
A=|0 1 0 | 
10 a? 


Si designamos las filas de la matriz identidad 3 x 3 por €,, €,, €,, entonces 
D(A) = Díze — 2%, €, & + 136). 
Puesto que D es lineal como función de cada fila, 
D(A) = xD(a, en & + 2%) — 21D(63, €, € + Tea) 
= 2D(e, € 1) + ‘Dla, en, es) — 1*D(es, €2, 61) — D (es, €2, €). 
Puesto que D es alternada, se sigue que 
D(A) = (xt + 23D(a, e, e). 


Lema. Sea D una función 2-lineal con la propiedad de que D(A) = 0 para 
todas las matrices 2 x 2, A, sobre K que tienen filas iguales. Entonces D es al- 
ternada. 


Demostración. Lo que hay que demostrar es que si A es una matriz 2 x 2 
y si A' se obtiene intercambiando las filas de A, entonces D(4') = — D(A). 
Si las filas de A son a y fi, ello quiere decir que se debe demostrar que D(f, a) = 
—D(a, p). Como D es 2-lineal, 


D(a + B, a + 6) = D(a, a) + Dla, B) + D(B, a) + DB, 6). 
Por la hipótesis, D(a + f, a + $) = Día, a) = D(f, B) = 0. Luego 
0 = Día, $) + DE, a). I 


Lema. Sea D una función n-lineal de las matrices n x n sobre K. Supón- 
gase que D tiene la propiedad de que D(A) = 0, siempre que dos filas adyacentes 
de A sean iguales. Entonces D es alternada. 


Demostración. Debe demostrarse que D(4) = 0 cuando dos filas cuales- 
quiera de A son iguales, y que D(A’) = — D(A) si A' se obtiene por intercambio 
de dos filas de A. Primero supóngase que A' se obtiene por intercambio de dos 
filas adyacentes de A. El lector verá que el razonamiento dado en la demostra- 
ción del lema anterior se extiende al presente caso y da D(4') = — D(A). 
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Ahora sea B obtenida por intercambio de dos filas į y j de A, con i < j. Se 
pucde obtener B de A por medio de una sucesión de intercambios de pares de 
filas adyacentes. Se comienza intercambiando la fila ¿ con la fila (i + 1) y con- 
tinuando hasta que las filas queden en el orden 


O). y anata > + > y Oj, Oliy Ojqly o + y Ono 


listo requiere k = j — i intercambios de filas adyacentes. Se mueve ahora a; a 
la posición ¿ haciendo {k — 1) intercambios de filas adyacentes. Se obtiene 
así B a partir de A por k + (k — 1) = 2k — 1 intercambios de filas adyacen- 
tes. Con lo que 

D(B) = (—D)*"D(4) = —D(4). 


Supóngase que A es cualquier matriz n x n con dos filas iguales, digamos g; = &;, 
con į < j. Sij = i + 1, entonces A tiene dos filas adyacentes iguales y D(A) = 0. 
Si j > i + 1, se intercambian 0,,, y a, y la matriz resultante B tiene dos filas 
adyacentes iguales, entonces D(B) = 0. Por otro lado, D(B) = — D(A), luego 
D(A)=0. I 


Definición. Sin > 1 y A es una matriz n x n sobre K, designemos por A(i\j) 
la matriz (n — 1) x (n — 1) que se obtiene eliminando la i-ésima fila y la j-ésima 
columna de A. Si D es una función (n — 1)-lineal y A es una matriz n x n, se 
hace D¡¡(A) = D[A(il 7]. 


Teorema 1. Sean > 1 y sea D una función (n — 1)-lineal alternada de las 
matrices (n — 1) x (n — 1) sobre K. Para todo j, 1 < j < n, la función E) de- 
finida por 
(5-4) EA) = E (-1Y4,D, (4) 

i=1 


es una función n-lineal alternada de las matrices n x n, A. Si D es una función 
determinante, también lo es Ej. 


Demostración. Si A es una matriz n x n, D;;(A) es independiente de la 
fila ¿ de A. Como D es (n — 1)lineal, es claro que Dj, es lineal como 
función de cualquier fila, excepto la fila i. Por tanto, 4;;D;;(4) es una fun- 
ción n-lineal de A. Una combinación lineal de funciones n-lineal es n-lineal; 
luego E, es n-lineal. Para demostrar que E, es alternada bastará demostrar 
que E;(4) = 0 siempre que A tenga dos filas iguales. Supóngase que 0%, = %+1- 
Sii4kyid4k<+ 1, la matriz A(ils) tiene dos filas iguales, y así D,,(A) = 0. 
Por tanto, 


EA) = (—DPA5Di(A) + (—DEAHA a miDeroslA). 
Como Qk = %+1> 
Ar = Aam; y Alk = Alk + 117. 
Entonces es claro que E;(4) = 0. 


Supóngase ahora que D es una función determinante. Si 1” es la matriz 


EÉEES SE A á( e e -—. RÁ 


AA SÓ. AAA AT AA A dt AA A AA o a - 
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identidad n x n, entonces I®(j|j) es la matriz identidad (n — 1) x (n — 1), Entonces 
ID. Como If? = ô, se sigue de (5-4) que 
EXA =1 — E ea 
(5-5) E(1W) = DU), (4) = (2 de MS E De (2 — 1)(& — 2)( — 3) 
Ahora, D(I""")= 1, de donde E¡(1”) = 1 y E; es una función determinante. | EXA) = al pi a 3 
= g= 

Corolario. Sea K un anillo conmutativo con unidad, y sea n un entero posi- = (z — 1)(z — 2-3) 

tivo. Existe al menos una función determinante sobre K"™". 
r > 4 HA . Aa DA z- 1 A E z? 

Demostración. Se ha demostrado la existencia de una función determi- F(A) = zo = + (z — 3) p 

nante sobre matrices 1 x 1 sobre K y también sobre matrices 2 x 2 sobre K. aa, 


= (z — da — Día — g 


(b) Sea K= R y o 
A=|lo0 0 1| 
100 


El Teorema 1 dice explícitamente cómo construir una función determinante 
sobre matrices n x n, dada tal función sobre matrices (n — 1) x (n — 1). El 
corolario se demuestra por inducción. $ 


Ejemplo 5. Si B es una matriz 2 x 2 sobre K, sea 


Entonces 10 
1B| = BuBn — BuBa. E(A) = f 1 = 
Entonces |B| = D(B), donde D es la función determinante sobre las matrices EXA 0 14 _ 
2 x 2. Hemos mostrado que esta función sobre K?*? es única. Sea (4) = CO e 
O 1 
Exa) = |? o=: 


An An An 
A=]| An An Áz 
An As As Ejercicios 
1. Cada una de las siguientes expresiones define una función D sobre el conjunto de las 


matrices 3 x 3 sobre el cuerpo de los números reales. ¿En qué casos es D una función 
dlincal? 


una matriz 3 x 3 sobre K. Si se define E,, E), E, como en (5-4), entonces 


(5-6) E(A)= An pe a n Algo sl + Anas ie (a) D(A) = Au + An + Au; 
e + A oi (b) D(A) = (Au)? + 3A14m; 
Y e 2 n B_ u 13| (c) D(A) = Anånås; 
A 4 + Aalan al Ala Aa (d) D(A) = Audadn + 5Andaba; 
A An Am] An Ay An Ax (e), D(A) =O; 
69 m= Adat ge- fae ael Ajan ae) © DÍA) = 


2. Verificar directamente que las tres funciones E,, E,, E, definidas por (5-6), (5-7) y (5-8) 
Se sigue del Teorema 1 que E,, Ez, E, son funciones determinantes. En reali- jon idénticas. 
dad, como se verá más adelante, E, = E, = E}, pero esto no se ve, incluso 
en este caso sencillo. Se podría, sin embargo, comprobar en forma directa desarro- 
llando cada una de las expresiones anteriores. En vez de hacerlo se dan algunos 


ejemplos concretos. 


3, Sea K un anillo conmutativo con unidad. Si A es una matriz 2 x 2 sobre K, la adjunta 
We A es la matriz 2 x 2, adj A, definida por 
An =4eb 

—Aa An 
Sı det representa la función determinante única de las matrices 2 x 2 sobre K, demos- 
War que 

(a) (adj A)A = A(adj A) = (det A)I; 

(b) det (adj A) = det (A); 

(c) adj (4% = (adj A). 
14" denota la transpuesta de 4.) 


adj A = 


(a) Sea K = R[x], y 
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Demostrar que 
(a) D(0) = 0; 
(b) D(4) = 0 si 4? = 0; 
(c) D(AB) = — D(A) si B se obtiene por intercambio de las filas (o columnas) de A; 
(d) D(4) = 0 si una fila (o columna) de A es 0; 
(e) D(A) = 0 si A es singular. 


4. Sea A una matriz 2 x 2 sobre un cuerpo F. Demostrar que A es inversible si, y solo 
det A +0. Si A es inversible, dar una fórmula para A`". 


5. Sea A una matriz 2 x 2 sobre un cuerpo F y supóngase que A? = 0. Demostrar qu 
para todo escalar c, det (c7 — A) = œ. 


6. Sea K un subcuerpo de los números complejos y n un entero positivo. Sean ji, ..., 


y kis « - - » Kn enteros positivos no mayores que n. Para una matriz n x n sobre K se defin 14. Sea A una matriz 2 x 2 sobre el cuerpo F. Entonces el conjunto de todas las matri- 


D(A) = A(n k) Alie, ka) ==" Aún Kn). ves de la forma f(4), donde f es un polinomio sobre F, es un anillo conmutativo con uni- 
dad K. Si B es una matriz 2 x 2 sobre K, el determinante de B es entonces una matriz 2 x 2 
Demostrar que D es n-lineal si, y solo si, los enteros j}, ..., ja son distintos. sobre F, de la forma f(4). Supóngase que 7 es la matriz unidad 2 x 2 sobre F y que B es 


E A E ES A la matriz 2 x 2 sobre K 
7. Sea K un anillo conmutativo con unidad. Demostrar que la función determinant 


sobre las matrices 2 x 2, A, sobre K es alternada y 2-lineal como función de las col 
nas de A. 


B= A— Aul -A 7 
—Anl A- Agl 

8. Sea K un anillo conmutativo con unidad. Se define una función D sobre las matri 

3 x 3 sobre K por la regla 


Az An 
An Asa 


Demostrar que det B = f(A), donde f = x? — (4,, + 4Az2)x + det A y también que 
NA) =0. 


D(A) = An det 


-duden 4 da a, 


An A An Ax 


Demostrar que D es alternada y 3-lineal como función de las columnas de A. 


2] + Ay det 
5.3. Permutaciones y unicidad 
de los determinantes 
9. Sea K un anillo conmutativo con unidad y D una función alternada y n-lincal sol 
las matrices n x n sobre K. Demostrar que 

(a) D(A) = 0 si una de las filas es 0; 

(b) D(B) = D(A) si B se obtiene de A por adición de un múltiplo escalar de una 
de A a otra. 


En esta sección demostraremos la unicidad de la función determinante 
sobre matrices n x n sobre K. La demostración conducirá de una manera na- 
tural a estudiar las permutaciones y algunas de sus propiedades básicas. 

Supóngase que D es una función alternada n-lineal sobre las matrices n x n 


10. Sean F un cuerpo, A una matriz 2 x 3 sobre F y (c,, cz, C3) el vector en F> defini sobre K. Sea A una matriz n x n sobre K con filas 01, œz, ... ., 0%. Si se repre- 


Hobo sentan las filas de la matriz unidad n x n sobre K por €;, €z, ..., €n, entonces 
_ |Ar Ei _ lA An _ |An pe (5-9) a = y A(, Des 1<:i<xm 
AS A a s Hal e de DT 
Luego 


Demostrar que 

(a) rango (4) = 2 si, y solo si, (c1, €z, c3) + 0; 

(b) si A tiene rango 2, entonces (c,, C,, cz) es una base para el espacio de las sol 
nes del sistema de ecuaciones 4X = 0. 


D(A) =D E A(1, He; 02, -.., an) 


= Z Al, Den an - - - , an). 
I 

11. Sea K un anillo conmutativo con unidad y sea D una función alternada 2-lineal sol 

las matrices 2 x 2 sobre K. Demostrar que Di4) = (det A)D(I) para toda A. Usar 

resultado (no son lícitos cálculos con los coeficientes) para demostrar que det (4B) 

(det A)ídet B) para cualesquiera matrices 2 x 2, A y B, sobre K. 


Si ahora se remplaza a, por È A(2, k)e,, se ve que 
k 


Dle; 0%)... On) = z A(2, k)D(e;, Ekee ey an). 


12. Sea F un cuerpo y D una función sobre las matrices n x n sobre F (con valores en p puss, > 
Supóngase que D(4B) = D(A)D(B) para todo A, B. Demostrar que D(4) = 0 para t D(A) = Z A, DAQ, K)D(e;j, €x, - - > , Am). 
A, o bien D(I) = 1. En este último caso demostrar que D(A) + 0 si A es inversible. s gi 
En D(€j, €x, - - - , %,) se remplaza ahora o, por E A(3, 1)e, y asi sucesivamente. 
Finalmente, se obtiene una expresión complicada, pero teóricamente impor- 


tante de D(A), a saber, 
(5-10) D(A) = 


13. Sea R el cuerpo de los números reales y sea D una función sobre las matrices 2 x 
sobre R, con valores en R, tales que D(AB) = D(4)D(B) para cualesquiera A, B. Supó 


gase que, además, 
0 1 10 
(E 01)=>(o 1D) 


z TAS ki) A (2, kə) - -- A(n, kn)D(erss Eo > - «1 En)» 
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En (5-10) la suma se extiende sobre todas las sucesiones (k4, kz, - - ., Kn) de 
teros positivos no mayores que n. Esto demuestra que D es una suma fini 
de funciones del tipo descrito en (5-2). Debe observarse que (5-10) es una co! 
secuencia directa de la suposición de que D es n-lineal, y que un caso particula 
de (5-10) se obtuvo en el Ejemplo 2. Como D es alternada, 


Deks Ets » - - 1 €). = 0 


siempre que dos de los índices k; sean iguales. Una sucesión (kı, kz, ..., Kn 
de enteros positivos no mayores que n, con la propiedad de que no haya d 
de los k; iguales, se llama permutación de grado n. En (5-10) necesitamos, 
tanto, sumar solamente sobre aquellas sucesiones que son permutaciones de 
grado n. 

Como una sucesión finita, o n-tuple, es una función definida sobre los pri- 
meros n enteros positivos, una permutación de grado n puede definirse comi 
una función biyectiva del conjunto (1, 2, . . . , n} sobre sí mismo. Una tal funció 
o corresponde a un n-tuple (0,, 07, ..., 0,) y es, por tanto, simplemente ui 
regla para ordenar 1, 2, ..., n en alguna forma bien definida. 

Si D es una función alternada n-lineal y A es una matriz n x n sobre K. se 
tiene entonces 


(5-11) D(A) = ZA(l, 01) --- A(n, on)D(én, - - 


26) 


donde la suma se extiende sobre las distintas permutaciones a de grado n. 
A continuación mostraremos que 


(5-12) Dlan: - -, €m) = ED(61, . . ., €n) 


donde el signo + depende solo de las permutaciones ø. La razón de ello es como 
sigue. La sucesión (01, 02, . . . , øn) se puede obtener de la sucesión (1, 2, ..., a) 
por un número finito de intercambios de los pares de clementos. Por ejemplo, 
si al + 1, se puede transponer 1 y øl, obteniéndose (ol, ..., al, ...). Proce- 
diendo así se puede llegar a la sucesión (cl, ..., an) después de n o menos de 
tales intercambios de pares. Como D es alternada, el signo de su valor cambia 
cada vez que se intercambian dos de las filas €, y €j. Así, si se pasa de (1, 2,...., n) 
a (ol, 02, ..., an) por medio de m intercambios de pares (i, j), se tendrá 


Dlés » - - 1, €n) = (—1)"D(e,, - . 
En particular, si D es una función determinante 
(5-13) Dlén, . . ~ z €n) = ( 1)" 


donde m depende solo de o, y no de D. Así, toda función determinante asigna 
el mismo valor a la matriz de filas €,;, ..., €n, y este valor es 1 o —1. 

Sea ahora el siguiente hecho básico respecto de las permutaciones. Si g es. 
una permutación de grado n, se puede pasar de la sucesión (1, 2, ...,n) a la 
sucesión (01, 02, .... on) por una sucesión de intercambios de pares, y ello 
puede hacerse de diversas maneras; pero sin que importe cómo se haya hecho, 
el número de intercambios empleados es siempre par o impar. La permutación 
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se llama entonces par o impar, respectivamente. Se define el signo de una per- 
mutación por 
1, si ø es par 
sgn o = E 
—1, si o es impar 


representando aquí el símbolo «l» el entero 1. 

Se verá más adelante que esta propiedad básica de las permutaciones se 
puede deducir de lo que ya se sabe sobre funciones determinantes. Supóngase 
por ahora que ello sea así. Entonces el entero m en (5-13) es siempre par si o es 
una permutación par, y es siempre impar si ø es una permutación impar. Para 
una función alternada n-lineal se tiene entonces que 


Den, - - - , €n) = (Sgn 0)D(e, . .., €n) 


y por (5-11) 


(5-14) D(A) = E (sgn oJA(1, o1) --- A(n, en) | D(). 


Es claro que 7 representa la matriz identidad n x n. 
De (5-14) se ve que existe precisamente una función determinante sobre 
matrices n x n sobre K. Si se representa esta función por det, viene dada por 


(5-15) det (A) = 3 (sgn 0)A(1, ol) A A(n, on) 


donde la suma se extiende sobre las distintas permutaciones a de grado n. Todo 
esto se puede resumir formalmente como sigue. 


Teorema 2 Sea K un anillo conmutativo con unidad y sea n un entero po- 
sitivo. Existe exactamente una función determinante sobre eľ conjunto de las 
matrices n x n sobre K, y es la función det definida por (5-15). Si D es cualquier 
Junción alternada n-lineal sobre K"*", entonces para toda matriz n x n, A, 


D(A) = (det A)D(). 


Este es el teorema que habíamos buscado, pero se ha dejado un vacío en 
la demostración. Este vacío es la demostración de que —para una permutación 
dada a, cuando se pasa de (1, 2, ..., n) a (cl, 02, ..., an) por intercambio 
de pares— el número de intercambios es siempre par o impar. Este hecho com- 
binatorio básico puede ser demostrado sin referencia alguna a los determinantes. 
Pero quisiéramos indicar cómo se desprende de la existencia de una función 
determinante sobre las matrices n x n. 

Sea K el anillo de los enteros. Sea D una función determinante sobre las 
matrices n x n sobre K. Sea a una permutación de grado n y supóngase que 
se pasa de (1, 2, . . . , n) a (ol, 02, . . . , an) por m intercambios de los pares (i, j), 
i + j. Como se vio en (5-13) 


(=D” = D(en, . . - , €m) 


esto es, el número (—1)” debe ser el valor de D sobre la matriz de filas 


Esto ===> Ego Si 


Dheas - - - 1 €n) = 1, 
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entonces m debe ser par. Si 
Díén, - - 


entonces m debe ser impar. 

Como tenemos una fórmula explícita para el determinante de una mat 
n x n y en esta fórmula intervienen las permutaciones de grado n, concluim: 
esta sección haciendo algunas observaciones más respecto a las permutacio! 
Primero obsérvese que hay exactamente n!= 1-2---n permutaciones d 
grado n. En efecto, si ø es tal permutación, existen n elecciones posibles para al 
cuando esta elección se ha hecho, existen (n — 1) elecciones posibles pai 
02; luego (n — 2) elecciones para 03, y así sucesivamente. En consecucnci 
se tienen 


., €) = —1, 


n(n — 1)(n— 2) ---2-1=nm! 


permutaciones o. La fórmula (5-15) para det (4) da así el det (4) como sumi 
de n! términos, uno por cada permutación de grado n. Un término dado 
un producto 

A(1, 1) --- A(n, on) 


de n elementos de A, un elemento de cada fila y un elemento de cada columni 
precedido de signo «+» o «—», según que ø sea permutación par o impar, 

Cuando las permutaciones se consideran como biyecciones del conjun 
11, 2, ..., n} sobre sí mismo, se puede definir un producto de permutacion 
El producto de ø y q será simplemente la función compuesta øt definida 


(07)(0) = o(r(a)). 


Si e representa la permutación identidad, e(i) = i, entonces cada ø tiene ul 
inversa a ' tal que 


Se pueden resumir estas observaciones diciendo que, respecto de la operaci 
de composición, el conjunto de las permutaciones de grado n es un grupo. Esi 
grupo se llama grupo simétrico de grado n. 

Desde el punto de vista de productos de permutaciones, la propiedad bási 
ca del signo de una permutación es que 
(5-16) sgn (07) = (sgn 0)(sgn 7). 
Es decir, øt es una permutación par si gd y t son ambas pares o ambas impares, 
mientras que ot es impar si una de las dos permutaciones es impar y la otra 
es par; se puede ver esto por la definición del signo mediante los sucesivos in- 
tercambios de los pares (i, j). Puede ser también instructivo indicar cómo 
sen (ot) = (sgn o)(sgn 1) se desprende de una propiedad fundamental de los 
determinantes. 

Sea K el anillo de los enteros y sean ø y t permutaciones de grado n. Sean 
€» - --> €, las filas de la matriz identidad n x n sobre K. Sea A la matriz con 
filas €,1, . - ., €, y sea B la matriz con filas €,,,, . . . , €,n. La ¡-ésima fila de A tien: 


SPP - mm 
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exactamente un elemento no nulo, a saber, el 1 en la columna 1,. Por lo que es 
fácil ver que e,,, es la ¡-ésima fila del producto de matrices AB. Ahora 


det (4) = sgn q, det (B) = sgn g, y det (4B) = sgn (07). 


Así se tendrá que sgn (øt) = (sgn ø)(sgn 7), una vez, demostrado el siguiente 
teorema. 


Teorema 3. Sea K un anillo conmutativo con unidad y sean A y B matri- 
ces n x n sobre K. Entonces 


det (AB) = (det A)(det B). | 


Demostración. Sea B una matriz n x n dada sobre K, y para cada matriz 

n x n, A, defínase D(A) = det (AB). Si se designan las-filas de A por Q,,...., Op, 
entonces 

Dlar, .- 


., Gn) = det (œB, . . . , &nB). 


Aquí a,B representa la matriz 1 x n que es el producto de la matriz 1 x n, æj, y 
la matriz n x n, B. Como 
(cai + œ%)B = ca¡B + 04B 


y det es n-lineal; es fácil ver que D es n-lincal. Si a, = 
y como det es alternada 


aj, entonces œ; B = a/B, 


Dlo, - . . , &n) = 0. 


Luego D es alternada. Ahora bien, D es una función alternada n-lineal, y por 
el Teorema 2 


D(A) = (det A)D(I). 
Pero D(I) = det (IB) = det B, con lo que 
det (AB) = D(A) = (det A)(det B). | 


Que sgn (07) = (sgn o )(sgn t) es solo uno de los muchos corolarios del Teo- 
rema 3. Se considerarán algunos de estos corolarios en la siguiente sección. 


Ejercicios 


1. Si K es un anillo conmutativo con unidad y A es la matriz sobre K dada por 


0 ab 
A=|-a 0c 
=b —=e 0. 


2. Demostrar que el determinante de la matriz de Vandermonde 


1 a a 
E 
lee 


Demostrar que det A = 0. 


es (b — aMe — alle — b). 
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3. Escribir explícitamente las seis permutaciones de grado 3, decir cuáles son im] 
y Cuáles son pares y usar esto para dar la fórmula completa (5-15) del determinante de 
matriz 3 x 3. 


4. Sean ø y t las permutaciones de grado 4 definidas por c1 = 2,02 = 3,03 = 4,04 = 
1 =3,12=1,13=2, 4 =4. 

(a) ¿Es a impar o par? ¿Es t impar o par? 

(b) Hallar ot y to. 


Si A es una matriz n x n inversible sobre un cuerpo, demostrar que det A + 0. 


7 


5. 


6. Sea A una matriz 2 x 2 sobre un cuerpo. Demostrar que det (1 + A) = 1 + det 
si, y solo si, traza (4) = 0. 


7. Una matriz n x n, A, se llama triangular si 4;; = 0, siempre que i >j o si Aj == 
siempre que į < j. Demostrar que el determinante de una matriz triangular es el prod: 
Ar1Az2 °° ` An de los elementos de su diagonal. 


8. Sea A una matriz 3 x 3 sobre el cuerpo de los números complejos. Formamos la mal 
xI — A con elementos polinomiales, siendo el elemento i, j de esta matriz el polino: 
ôx — Aij- Si f = det (xI — A), demostrar que f es un polinomio mónico de grado 
Si se escribe 


$ = (2 a)(z — o) (2 — cs) 


con números complejos cı, €z y Cy, demostrar que 


Cı + C, + C3 = traza (A) y CCC; = det A. 


9. Sea n un entero positivo y F un cuerpo. Si g es una permutación de grado n, d 
trar que la función 


Planar a) (ay < aer den) 


es un operador lineal inversible en F”. 


10. Sean F un cuerpo, n un entero positivo y S el conjunto de las matrices n x n sobre 
Sea V el espacio vectorial de todas las funciones de S en F. Sea W el conjunto de las 
ciones alternadas n-lineales sobre S. Demostrar que W es un subespacio de V. ¿Cuál es 
dimensión de W? 


11. Sea T un operador lineal sobre F". Defínase 


Dr(04, . . . ,0n) = det (Toa, . . . , Ton). 


(a) Demostrar que D. es una función alternada n-lineal. 
(b) Si 
c = det (Ten . . . , Ten) 


demostrar que para n vectores &;, ..., 0, arbitrarios se tiene 


det (Tor, . . - , Tan) = c det (a, » . - , An). 


(c) Si @ es cualquier base ordenada de F” y A es la matriz de T en la base ordenada 
demostrar que det A = c. 
(d) ¿Qué nombre apropiado se podría dar a c? 


12. Si o es una permutación de grado n y A una matriz n x n sobre el cuerpo F con 
tores fila a,, ..., a,, sea o(4) la matriz n x n con vectores fila %,,, .. 


=> Wa 


—A ASE TA E3KÉ]ÑÉ—k—— 
Damian 


(a) Demostrar que c(4B) = o(4)B y, en particular, que 0(4) = o(1)A. 

(b) Si T es el operador lineal del Ejercicio 9, demostrar que la matriz de T en la base 
canónica es o(1). | 

(c) ¿Es o` (7) la matriz inversa de ø(7)? 

(d) ¿Es cierto que c(4) es semejante a A? 
13. Demostrar que la función signo de las permutaciones es única en el siguiente sentido: 
Sı f es cualquier función que asigna a cada permutación de grado n un entero y si f(a1) = 
Ho rf(t), entonces f es idénticamente 0 o f es idénticamente 1 o f es la función signo. 


5.4. Otras propiedades de los determinantes 


En esta sección mencionaremos algunas de las más importantes propie- 
dades de la función determinante sobre las matrices n x n. Probablemente 
lo primero que deberíamos señalar es lo siguiente. En el estudio de det 4, las 
filas de A han jugado un papel privilegiado. Como no existe diferencia funda- 
mental entre filas y columnas, se puede muy bien esperar que det A sea una 
función alternada n-lineal de las columnas de A. Este es el caso, y para demos- 
trarlo es suficiente hacer ver que 


(5-17) det (41) = det (4) 
donde A' representa la transpuesta de A. 
Si ø es una permutación de grado n, 
A*(i, 01) = A (ci, 1). 
Por la expresión (5-15) se tiene entonces 
det (41) = z (sgn 0)4 (01, 1) --- A (on, n). 


Si i = o` tj, A(øi, i) = A(j, o~ 'j). Con lo que 
A(o1, 1) --- A(on, n) = A(1, 0711) --- A(n, 07m). 


1 


Como co * es la permutación identidad 


(sgn o)(sgn o) =1 o sgn (07!) = sgn (o). 
Además, como ø varía sobre todas las permutaciones de grado n, también lo 
hace o7*. Por tanto, 


det (41) = 3 (sgnoDA(1, 0711) --- A(n, 07m) 


= det A 
que demuestra (5-17). 

En ciertas ocasiones se necesita calcular determinantes dados. Cuando ello 
es necesario, suele ser útil aprovechar la siguiente propiedad. Si B se obtiene 
de A por la adición de un múltiplo de una fila de A a otra (o un múltiplo de una 
columna a otra), entonces 


(5-18) det B = det A. 


A IA o AA AAA 
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Se demostrará la afirmación para las filas. Sea B la que se obtiene de A por la 
pn de ca; a a;, donde i < j. Como det es lineal como función de la i-ésima 
ila 
det B = det A + c det (01, -.., Oj...) Uso. -3 Qn) 
= det A. 
Otra propiedad útil es la siguiente. Supóngase que tenemos una matriz 
n x n en forma de bloque 
fi B 
0 € 


donde A es una matriz rx r, C una matriz s x s, B una matriz r x s y O re- 
presenta la matriz nula s x r. Entonces 


(5-19) det ki A = (det A) (det C). 
Para demostrarlo, se define 


A B 
D = 
(A, B, C) = det E ej 


Si fijamos A y B, entonces D es alternada y s-lineal como funció 
de C. Así, por el Teorema 2 y a aen e 
D(A, B, C) = (det C)D(A, B, 1) 
donde Z es la matriz ideutidad s x s. Restando múltiplos de las filas de 7 de 
las filas de B y usando la afirmación (5-18), se tiene 
D(A, B, I) = D(A, O, I). 
Ahora, D(A, 0, I) es evidentemente alternada y r-lineal como función de las 
filas de A. Así, pues, 
D(A, 0, I) = (det A)D(I, 0, I). 
Pero D(Z, 0, I) = 1. con lo que 
D(A, B, C) = (det C)D(A, B, I) 
= (det C)D(A, O, I) 
= (det C) (det A). 


Por un razonamiento del mismo tipo, o tomando transpuestas 
A 
(5-20) det | 4 e] = (det 4)(det C). 


Ejemplo 6. Supóngase que K es el cuerpo de los números racionales y 
que se desea calcular el determinante de la matriz 4 x 4 


re—1 2 3 
2 2 0 Z 
A= - 
4 Lohet 
1 2 3 0, 


Restando múltiplos adecuados de la fila 1, de las filas 2, 3 y 4, obtenemos la 
matriz 


(E 
a 
l 
o 
| 
m 
w 


3 tr == 


que según (5-18) tiene la misma matriz que 4. Si se resta 3 veces la fila 2 de la 
fila 3 y luego se resta 3 veces la fila 2 de la fila 4, se tiene 

1 -1 2 3 

0 4 —4 —4 

0 0 —4 —8]- 

0 0 4 O, 


y nuevamente det B = det A. La forma bloque de B dice que 


1 —1 |-4 —8 
det A = det B =|, Al e ol = 4(32) = 198. 

Sea ahora n > 1 y sea A una matriz n x n sobre K. En el Teorema 1 se vio 
cómo construir una función determinante sobre las matrices n x n, dada una 
de las matrices (n — 1) x (n — 1). Ahora que se ha demostrado la unicidad 
de la función determinante, la fórmula (5-4) dice lo siguiente. Si se fija cual- 
quier columna de índice j, 


det A = 2 (—1)+A ¿ det A(G). 
fa 
El escalar (—1)Y det A(i|j) se suele Hamar cofactor i, j de A, o cofactor del 
elemento i, j de A. La expresión anterior para det A es entonces llamada desarro- 


llo del det A por cofactores de la j-ésima columna (0, a veces, desarrollo por 
menores de la j-ésima columna). Si se hace 


Cy = (—1)'™ det A (èj) 
entonces la expresión anterior dice que para cada j 
det A = È AsCu 
fa 
donde el cofactor C;, es (—1)'*? veces el determinante de la matriz (n — 1) x 


(n — 1) que se obtiene suprimiendo la fila i y la columna j de A. 
Si ¡+ k, entonces 


ACz = 0. 


OXE 


En efecto, remplazando la columna j de A por su columna k y llamando B la 


matriz resultante, entonces B tiene dos columnas iguales y, por tanto, 
det B = 0. Como B(i|j) = Ali|j), se tiene 
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0 = det B 
n 
> 2 (—1)*+B;; det B(ilj) 
= È (~IA det Ad) 
a 
= 3 AaCs 
Estas propiedades de los cofactores pueden resumirse con 
(5-21) 2 ACi; = ôx det A. 


La matriz n x n, adj A, transpuesta de la matriz de los cofactores de A 
se llama adjunta de A. Así 


` 


(5-22) (adj A); = Ci = (—1)*+ det A (jli). 
Las expresiones (5-21) pueden resumirse en la ecuación matricial 
(5-23) (adj AJA = (det A)I. 


Queremos ver también que A(adj A) = (det A). Como Alili) = AQUÍ, 
se tiene 
(—1)* det At(ilj) = (—Di+ det A (Gli) 
que dice simplemente que el cofactor i, j de A! es el cofactor j, i de A. Con lo que 
(5-24) adj (4% = (adj A)‘ 
Aplicando (5-23) a A", se tiene 


(adj A9A! = (det A] = (det A)7 


y transponiendo 
A(adj A’)! = (det AJI. 

Usando (5-24) se tiene lo que se deseaba: 
(5-25) A(adj A) = (det A)I. 

Como para las matrices sobre un cuerpo, una matriz n x n, A, sobre K, 
se dice inversible sobre K si existe una matriz n x n, A7*, con elementos en K, 
tal que Aa = A7*A = I. Si tal matriz existe, es única; en efecto, con el mis- 
mo razonamiento usado en el Capitulo 1, se ve que cuando BA = AC = I 
tenemos que B = C. Las fórmulas (5-23) y (5-25) nos dicen lo siguiente acerca 
de la inversión de matrices sobre K. Si el elemento det A tiene un inverso mul- 
tiplicativo en K, entonces A es inversible y A7* = (det 4)7* adj A es la inversa 
única de A. Recíprocamente, es fácil ver que si A es inversible sobre K, el elemen- 
to det A es inversible en K. Para ello, si BA = I se tiene 


1 = det I = det (AB) = (det A)(det B). 
Lo demostrado es el siguiente teorema, 


Teorema 4. Sea A una matriz n x n sobre K. Entonces A es inversible 
sobre K si, y solo si, det A es inversible en K. Cuando A es inversible, la inversa 
única de A es 

A7* = (det AY * adj A. 


En particular, una matriz n x n sobre un cuerpo es inversible si, y solo si, su de- 
terminante es distinto de cero. 


Debemos señalar que este criterio decisivo para la inversión demuestra 
que una matriz n x n con una inversa a la izquierda o a la derecha es inver- 
sible. Esta demostración es completamente independiente de la demostración 
que se dio en el Capítulo 1 para las matrices sobre un cuerpo. Queremos tam- 
bién indicar qué quiere decir la inversión para matrices con elementos polino- 
mios. Si K es el anillo de los polinomios F[x], los únicos elementos de K que 
son inversibles son los polinomios escalares no nulos. En efecto, si f y g son 
polinomios y fg = 1, se tiene grd f + grd g = 0, con lo que grd f = grd g = 0; 
es decir, f y g son polinomios escalares. Así, una matriz n x n sobre el anillo 
de los polinomios F[x] es inversible sobre F[x] si, y solo si, su determinante 
es un polinomio escalar no nulo. 


Ejemplo 7. Sea K = R[x] el anillo de los polinomios sobre el cuerpo 
de los números reales. Sea 


4gs 2-1 1 a? — 2443 


Entonces, por un cálculo breve, se tiene que det 4 = x + 1 y det B = —6. 
Con lo que A no es inversible sobre K. Obsérvese que 


1 E. yd Ñ T =z- 2 
—r+1 eno ela 3 23 


y (adj A)A = (x + 1), (adj B)B = —61. Es claro que 


s+ de B=| z-i AT 
z 


aja =[ 


-22 


Eal 2 : 
BPS ¡OA la 


Ejemplo 8. Sea K el anillo de los enteros y 


1 2 
a=[; 4f 


3 4 2 
adj A =[-3 1] 


Así que A no es inversible como matriz sobre el anillo de los enteros; sin em- 
bargo, se puede también considerar A como matriz sobre el anillo de los nú- 
meros racionales. En tal caso A es inversible y 


Entonces det A = —2 y 
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ea 


En relación con matrices inversibles queremos mencionar otro hecho el 
mental. Las matrices semejantes tienen el mismo determinante; esto es, si P 
inversible sobre K y B = P7*AP, entonces det B = det A. Esto es claro, pu 


det (P4P) = (det P—1)(det A) (det P) = det A. 


Esta simple observación permite definir el determinante de un operador lineal 
sobre un espacio vectorial de dimensión finita. Si T es un operador lineal sobre 
V, se define el determinante de 7 como el determinante de cualquier matri 
ñ x n que representa a T en una base ordenada de V. Como todas esas matri- 
ces son semejantes, todas tienen el mismo determinante y la definición tiene 
sentido. Referente a esto véase el Ejercicio 11 de la Sección 5.3. 

Se va a estudiar ahora la regla de Cramer para resolver sistemas de ecua- 
ciones lineales. Supóngase que A es una matriz n x n sobre el cuerpo F y que 
se desea resolver el sistema de ecuaciones lineales AX = Y para algún n-tuple 


(Yis “==> Jn). Si AX = Y, entonces 
(adj AJAX = (adj A)Y 
y así 
(det A)X = (adj 4)Y. 
Con lo que 


(det A)z; 


[i 


E, (edj Aso 


2 (—1)*+y; det A (ilj). 


Esta última expresión es el determinante de la matriz n x n que se obtiene al 
remplazar la columna j de A por Y. Si det A = 0, nada de esto tiene sentido; 
sin embargo, si det A + 0, se tiene la conocida regla de Cramer. Sea A una ma- 
triz n x n sobre el cuerpo F tal que det A + 0.Siy,,... s Yn SON escalares cuales- 


quiera de F, la solución única X = A7*Y del sistema de ecuaciones AX = Y 
viene dada por 


A det B; ii 
7? detA J S 
donde B; es la matriz n x n que se obtiene de A remplazando la columna j de 
A por Y. 

Al concluir este capítulo deseamos hacer algunos comentarios que sirvan 
para ubicar los determinantes en lo que se cree que es la perspectiva adecuada. 
De vez en cuando es necesario calcular determinantes, y esta sección se dedicó par- 
cialmente a métodos que facilitan tal trabajo. Pero el papel principal de los deter- 
minantes en este libro es teórico. No se disputa la belleza de cuestiones como 
la regla de Cramer. Pero la regla de Cramer es un instrumento ineficaz para 
resolver sistemas de ecuaciones lineales, sobre todo porque supone demasia- 
dos cálculos. Por tanto, uno debe concentrarse en lo que dice la regla de Cramer, 


¿1 


_k A A. dd. 
O a. A A AA A A cc. ¿ici 
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más bien que en cómo calcular con ella. Ciertamente, cuando o 
sobre este capítulo, esperamos que el lector insista más en entendes boi 
lunción determinante y cómo se comporta que en cómo se calculan 

nantes de matrices dadas. 


Ejercicios 


1. Usar la expresión de la adjunta para calcular la inversa de cada una de las siguientes 


matrices 3 x 3. 
-2 3 2 cosé 0 —sen ð 
6 0 1 [ O at 0 
4 1 —1 senĝ 0 cos 6. 


2. Usar la regla de Cramer para resolver los siguientes sistemas de ecuaciones lineales 
sobre el cuerpo de los racionales. 
(a) z+ y+ 2=11 
22-6y- z= 0 
3x+4y +2 = 0. 
(b) 3x-2y= 7 


3y—2z= 6 
3z — 2z = —1 i a 
3. Una matriz n x n, A, sobre un cuerpo F es antisimétrica si A' = — A. Si A es una ma 


j impa $ det A = 0. 
triz n x n antisimétrica con elementos complejos y n es impar, demostrar que 


4. Una matriz n x n, A, sobre el cuerpo F se dice ortogonal si AA = [SIA e. 
demostrar que det A = +1 Dar un ejemplo de una matriz ortogonal para 
det A = —1. 


5. Una matriz n x n, A, sobre el cuerpo de los números complejos se dice AE e 
AA* = I (A* denota la transpuesta conjugada de 4). Si A es unitaria, demostrar q 
[det A| = 1. dy 
6. Sean T y U dos operadores lineales sobre el espacio vectorial V de dimensión finita. 
Demostrar que 

(a) det (TU) = (det T)(det U). 

(b) T es inversible si, y solo si, det T + 0. 
7. Sea A una matriz n x n sobre K un anillo conmutativo con unidad. SuPpóngase que 
A tiene la forma bloque: 


A 0 0 

0 

ie E 
0.0 -- A 


donde las A, son matrices rj x rj. Demostrar que 
det A = (det A)(det A2) --* (det Ax). 


8. Sea V el espacio vectorial de las matrices n x n sobre el cuerpo F. Sea E 
fijo de V y sea Ty el operador lineal sobre V definido por Tẹ(4) = AB — BA. Del 
que det Tg = 0. 


¡a 


http://libreria-universitaria.blogspot.com Algebra 


9. Sea A una matriz n x n sobre un cuerpo, A + 0. Si r es un entero positivo cualquiera 
entre 1 y n, una submatriz r x r de A es cualquier matriz r x r que se obtiene suprimiendo 
(n — r) filas y (n — r) columnas de A. El rango de A es el mayor entero positivo r tal que 
alguna submatriz r x r de A tiene determinante no nulo. Demostrar que el rango de A es 
igual al rango de fila de A (= rango columna de A). 


10. Sea A una matriz n x n sobre el cuerpo F. Demostrar que existen a lo más n escala- 
res ¢ distintos en F tal que det (c7 — A) = 0. 


11. Sean A y B matrices n x n sobre el cuerpo F. Demostrar que si A es inversible existen 
a lo más n escalares c en F para los cuales cA + B no es inversible. 


12. - Si V es el espacio vectorial de las matrices n x n sobre F y Bes una matriz n x n dada 
sobre F, sean Ly y Ry los operadores lineales sobre V definidos por L(A) = BA y 
Ra(4) = AB. Demostrar que 


(a) det La = (det B)"; 
(b) det Ra = (det B)". 


13. Sea V el espacio vectorial de todas las matrices n x n sobre el cuerpo de los núme- 
ros complejos y sea B una matriz n x n dada sobre C. Se define el operador lineal Mp en 
V por My(4) = BAB*, donde B* = B'. Demostrar que 


det Mp = [det B|”, 


Sea ahora H el conjunto de todas las matrices hermíticas en V; A es hermítica si A = A*. 
Entonces H es un espacio vectorial sobre el cuerpo de los números reales. Demostrar que 
la función Tp, definida por Tj(4) = BAB*, es un operador lineal sobre el espacio vectorial 
real H, y luego demostrar que Tp = [det B|?”. (Sugerencia: Al calcular det Tg, demostrar 
que Y tiene una base que consta de matrices hermíticas y entonces demostrar que det Ta = 
det Mp.) 

14. Sean A. B, C, D matrices n x n, conmutativas, sobre el cuerpo F. Demostrar que el 
determinante de la matriz 2n x 2n 
[e o] 
CD 


es det (AD — BC). 


5.5. Módulos 


Si K es un anillo conmutativo con unidad, un módulo sobre K es un sistema 
algebraico que se comporta en forma semejante a un espacio vectorial en que 
K hace las veces del cuerpo escalar. Para precisar, se dice que V es un módulo 
sobre K (o un K-módulo) si 


1. existe una adición (a, $) >a + ß en V, respecto de la cual V es gru- 
po conmutativo; 
2. existe una multiplicación (c, a) —> ca de elementos a en V y c en K tal que 


(a + caja = ca + eya 
clai + œ) = con + cas 
(cicaja = ci(cza) 
la = a. 
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Aquí el K-módulo más importante es el de los módulos n-tuples K". Los 
módulos de matrices K”*” son también importantes. Si V es cualquier módulo, 
se consideran combinaciones lineales, dependencia lineal e independencia lineal, 
tal como se hizo en un espacio vectorial. Hay que guardarse de aplicar a V cua- 
lesquiera resultados sobre un espacio vectorial que dependan de la división 
por escalares no nulos, operación de cuerpo que puede no ser lícita en el ani- 
llo K. Por ejemplo, si %,, ..., a, son linealmente dependientes, no se puede 
concluir que algún a, sea combinación lineal de los otros. Esto hace más difícil 
encontrar bases en módulos. 

Una base para el módulo V es un subconjunto linealmente independiente 
que genera el módulo. Esta es la misma definición que se dio para espacios 
vectoriales; y la propiedad importante de una base @ es que cada elemento 
de V puede expresarse unívocamente como combinación lineal de (algún nú- 
mero finito de) elementos de (B. Si se admite en matemática el axioma de elec- 
ción (véase Apéndice), se puede demostrar que todo espacio vectorial tiene 
una base. El lector está bien enterado de que existe una base en todo espacio 
vectorial generado por un número finito de vectores. Pero este no es el caso 
para los módulos. Por ello se necesitan nombres especiales para los módulos 
que tienen base y los que son generados por un número finito de elementos. 


Definición. El K-módulo se dice módulo libre si tiene una base. Si V tiene 
una base finita de n elementos, entonces V se dice un K-módulo libre con n ge- 
neradores. 


Definición. El módulo V es finitamente generado si tiene un subconjunto 
finito que genere V. El rango de un módulo finitamente generado es el menor 
entero k tal que los k elementos generen V. 


Se repite que un módulo puede ser finitamente generado sin tener una base 
finita. Si V es un K-módulo libre con n-generadores, entonces V es isomorfo 
al módulo K”. Si (B,, ..., Pa} es una base de V, existe un isomorfismo que 
aplica el vector c,B, + --- + cf, sobre el n-tuple (c,, ..., €p) de K". No es 
evidente, en forma inmediata, que el mismo módulo Y no pueda ser también 
un módulo libre con k generadores, con k + n. Es decir, no es obvio que dos 
bases cualesquiera de V deban tener el mismo número de elementos. La de- 
mostración de esto es una interesante aplicación de los determinantes. 


Teorema 5. Sea K un anillo conmutativo con unidad. Si V es un K-módulo 
libre con n generadores, entonces el rango de V es n. 


Demostración. Se tiene que demostrar que V no puede ser generado por 
menos de n de sus elementos. Como V es isomorfo a K”, se debe hacer ver que, 
si m < n, el módulo K” no es generado por los n-tuples Oj, <-> Gp. Sea A la 
matriz de filas x,, ..., m. Supóngase que cada uno de los vectores de la base 
canónica €,, .. ., €, sea combinación lineal de los a,, 7., Xm- Entonces existe 
una matriz P en K”*” tal que 


PA =I 
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donde / es la matriz identidad n x n. Sea 4 la matriz nX n que se obtiene 
adjuntar n — m filas de O a la parte inferior de A y sea P cualquier matriz n x 
que tiene las columnas de P como sus primeras 7 columnas. Entonces 


BA=1 


Por consiguiente, det A + 0. Pero como m < n, al menos una fila de Ati 
todos los elementos 0. Esta contradicción muestra QUe &ı, ...> %n NO gene: 
ran K". B 


existencia de la función determinante, 
dada en el Capítulo 2. Por el Teorema 5, se sabe que «módulo libre de rango m» 
es lo mismo que el «módulo libre con n generadores». 

Si V es un módulo libre sobre K, el módulo dual V* consta de todas las fun: 
ciones lineales f de V en K. Si V es un módulo libre de rango n, entonces y* 
también un módulo libre de rango n. La demostración es la misma que pará 
espacios vectoriales. Si (Bi, -.., Pa} es una base ordenada de V, existe ui 
base dual {f,, ..., fn} asociada del módulo V*. La función f asigna a ca 
a de V su iésima coordenada respecto de [f,, .... Bn) 


a = (08 + <- + Ín(Bn- 
Si f es una función lincal sobre V, entonces 


S = FES ++: + Sn) 


5.6. Funciones multilineales 


El propósito de esta sección es colocar el estudio de los determinantes 
lo que se cree que es la perspectiva adecuada. Se estudiarán las formas multi 
lineales alternantes sobre módulos. Estas formas son la generalización natu: 
de los determinantes según los presentamos. El lector que no haya leído (o mi 
desee leer) la breve introducción sobre módulos de la Sección 5.5, puede aúl 
estudiar con provecho esta sección, leyendo cada vez «espacio vectorial sob 
F de dimensión n» en vez de «módulo libre sobre K de rango n'». 

Sea K un anillo conmutativo con unidad y seca V un módulo sobre K. 
r es un entero positivo. una función L de V= V x V x:::x Ven K 
dice multilineal si L(x,, ..., 0,) es lineal como función de cada x,, cuando l 
otros a, se dejan fijos; esto es. si para cada ¡ 


+ 
L(œ%,.-. 


Lía, .. .,0) =CLlor,..- 


<, Cai + Bo.. 


y O. » 
Bi --- 10): 
Una función multilineal en V” se llama también forma r-lineal sobre V o fi 

multilineal de grado r sobre V. Tales funciones se llaman r-tensores sobre 


kub ca y AA A aii 
a 
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La colección de todas las funciones multilincales sobre V” se denotará M'(V). 
Si L y M pertenecen a M'(V), entonces la suma L + M: 


(L + Mia, . - ., œ) = Llas ...,0r) + Mío. . 
es también multilineal; y, si c es un elemento de K, el producto cL: 


(cD)(o, . . 


- y r) 


« ¿ 07) = GL(6%).+ «iy 07) 


es multilineal. Por tanto, M'(V) es un K-módulo —un submódulo del módulo 
de todas las funciones de V” en K. 

Si r = 1, se tiene M'(V) = V*, ei módulo dual de funciones lineales sobre V. 
Las funciones lincales pueden ser también usadas para construir ejemplos de 
formas multilineales de órdenes más elevados. Si f}, . . . , f, son funciones linea- 
les sobre V, defíinase 


Lío, - - 0) = fila)falas) -> S.(ar). 


Evidentemente, L es una forma r-lincal en V. 
Ejemplo 9. Si V es un módulo, una forma 2-lineal sobre V se llama a me- 
nudo forma bilineal sobre V. Sea A una matriz n x n con elementos en K. En- 
tonces 
LX, Y) = Y'AX 

define una forma bilineal L sobre el módulo K"”**. Análogamente, 
Mía, b) = «Af' 

define una forma bilineal M sobre K”. 

Ejemplo 10. La función determinante asocia a cada matriz n x n, Á, 
un elemento det 4 en K. Si det A es considerado como función de las filas de A: 


det A = D(a.. 


- Qn) 
entonces D es una forma n-lineal en K”. 


Ejemplo 11. Es fácil lograr una expresión algebraica de la forma r-lineal 
general sobre el módulo K”. Si a,, ..., a, son vectores de V y A es la matriz 
r x n con filas %,, ..., a,, entonces, para cualquier función L de M'(K”), 


Llan.. Ll a Aijt, 0%) + -.> c) 
i= 


A) 


-, 05) 


2 Ay¡L(e;, 0%, - - 
j=1 


2 Asle D Arieh a) 
¿=1 j=1 


= Y Y AuyÁnllej, er, 03, - - - , 0) 
j=1k=1 
= Y AydmlLle, er, 03) - - - , 05). 


jk=1 
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Si se remplazan g, ..., 0, sucesivamente por sus expresiones como combi- 
naciones lineales de los vectores de la base canónica y si se escribe A(i, j) por 
Aij, se obtiene: 


(5-26) Lía, ..., 0) = 2, ' AC, ji) -++ Alr, Lleo - . - €s,)- 

E Oai 
En (5-26) hay un término por cada n-tuple J = (¡,, ..., j,) de enteros positi- 
vos entre 1 y n. Hay n” de tales r-tuples. Así, pues, L está completamente deter- 


minada por (5-26) y los valores particulares 


Cs = Lleo- - -s €) 


asignados a los n” elementos (€;,, . . ., €). Es también fácil ver que si para cada 
r-tuple J se elige un elemento cj de K, entonces 


(5-27) L(0,...,ar) = z A, ja) <+- Alr, jrjes 
define una forma r-lineal sobre K”. 


Supóngase que L es una función multilineal sobre V” y M es una función 
multilineal sobre V*. Se define una función L ® M sobre V”** por 


(5-28)  (LQ M)las.. 
Si se piensa de V”** como V” x V*, entonces para a en V” y $ en V* 
(LQ Mia, B) = L(o)M(5). 


Es claro que L ® M es multilineal sobre Y”**. La función L ® M se llama 
producto tensorial de L y M. El.producto tensorial no es conmutativo. En efec- 
to, M ® L + L Q M, a menos que L=0 o M = 0; sin embargo, el produc- 
to tensorial se relaciona perfectamente con las operaciones modulares en 
My M’. 


-s Qr) = La, ..., a) M (ary, ..., A+). 


Lema. Sean L, L, formas r-lineales sobre V; sean M, M, formas s-lineales 
sobre V, y sea c un elemento de K. 


(a) ((L+L,)8M=cLG M)+ L, QM; 
b) LO (cM + M,)= «LQ M)+LQM.. 


Demostración. Se deja como ejercicio. 


El producto tensorial es asociativo, es decir, si L, M y N son (respectivamen- 
te) formas r-, s- y t-lineales sobre V, entonces 


(LOMON=L0Q (1 QN). 


Ello es inmediato por ser la multiplicación en K asociativa. Por tanto, si L}, 
L», . - . , Lẹ son funciones multilineales sobre Y”, ..., V™, entonces el producto 
tensorial 


L=LK0G:::QL 
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está definido, en forma inequívoca, como función multilineal sobre Y”, donde 


r =r, +>: + rę Se mencionó ya un caso particular al respecto. Si f,,...,.f 
son funciones lineales sobre V, entonces el producto tensorial 
L=10-::0f 


viene dado por 
L(0,..., a) = filar) -+> fela). 


Teorema 6. Sea K un anillo conmutativo con unidad. Si V es un K-módulo 
libre de rango n, entonces M'(V) es un K-módulo libre de rango n"; en efecto, 
si {fis - - -, fa} es una base para el módulo dual V*, los n" productos tensoriales 


$1 9:90 fis 
forman una base de M'(V). 


Demostración. Sea (fi, ..., fi} una base ordenada de V* que es dual 
de la base (f,, ..., Bn} de V. Para todo vector a de V se tiene 


a = fila)bı + -++ + fala)Bn. 


Se hacen ahora los cálculos realizados en el Ejemplo 11. Si L es una r-forma 
lineal sobre V y a,, ..., a, son elementos de V, entonces por (5-26) 


L(a,...,%) = 7 2 y Saloa) ++ filo) LlBio - - - , Bi). 


I<SjiS<nm...,1<j/<n 


En otras palabras, 


(5-29) L one: LBi «+ Bid D +++ Din 


Esto muestra que los »” productos tensoriales 
Es = GO Di 
dados por los r-tuples J = (j,, ..., j,) generan el módulo M'(V). Se ve que 


las diversas r-formas E, son independientes como sigue. Supóngase que para 
cada J tenemos un elemento c; en K y formamos la función multilineal 


(5-30) 


(5-31) L= z ciEj. 


Obsérvese que si 7 = (i, ..., Ł), entonces 


= Jo y 
eB) =i I=. 


E(B - - 
Por tanto, se ve por (5-31) que 
(5-32) cr = L(Bi, . - - , Bi). 


En particular. si L = 0, entonces c; = 0 para todo r-tuple 7. | 


A q EI 
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Definición. Sea L una forma r-lineal sobre un K-módulo V. Se dice que 
L es alternada si L(a,, ..., 0,)=0, siempre que a; = «j, con ¡4 j. 


Si L es una función multilineal alternada sobre V”, entonces 
Llan... <s r) = —Llo, . . 


Es decir, si se transponen dos de los vectores (con indices diferentes) del r-tuple 
(%1, - . ., &,), el valor asociado de L cambia de signo. Como toda permutación 
o es un producto de transposiciones, se ve que L(%,1, ..., or) = (sgn 0) 
loto mesiióo a). 

Se designa por A'(V) la colección de todas las formas r-lineales sobre V. 
Es fácil ver que A'(V) es un submódulo de M'(V). 


as ed ey jy a 9 i A 


Ejemplo 12. Al comienzo de este capítulo se vio que sobre el módulo K” 
existe precisamente una forma alternada n-lineal D con la propiedad de que 
D(€,, ..., €) = 1. También se demostró, en el Teorema 2, que si L es cual- 
quier forma de A"(K"), entonces 


LM e De 


O sea que A"(K") es un K-módulo libre de rango 1. También se desarrolló una 
fórmula explícita (5-15) para D. En términos de la notación que ahora esta- 
mos usando, dicha fórmula se puede escribir 


(5-33) D= z (sgn 0) fa ® -+ ® fon- 


donde f,, - . ., f, son las funciones coordenadas canónicas sobre K” y la suma 
se extiende sobre las n! permutaciones diferentes ø del conjunto {1, ..., n} 
Si escribimos el determinante de una matriz Æ como 


det A = 2.(sgn o) A(o1, 1) --- A(on, n) 
entonces se obtiene una expresión diferente de D: 


(5-34) D(o, ..-, 0) = z (sgn 0) fi(%1) - - - falden) 


+ Qan) 


= Y (sgn 0) Llan, - - 
donde L = fi Q: O fr 


Hay un método general para asociar una forma alternada a wna forma mul- 
tilincal. Si L es una forma r-lineal sobre un módulo V y si ø es una permutación 
de (1, ..., r}, se tiene otra función r-lineal L, definiendo 


Lolas . . . , 0) = Llas - - - 


Si L resulta alternada, entonces L, = (sgn a)L. Ahora, para cada L en M'(V) 
se define una función x,L£ en M'(V) por 


(5-35) 1,L = Y (sgn 0)L, 


3 Qor). 


— ooo O o yqTO0A e 
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esto es, 
(5-36) (T-L) (an . - - , er) = È (gn 0) Llosa, . . - , or). 
Lema. n, es una transformación lineal de M'(V) en A'(V). Si L está en A (V), 
entonces 7,L = r!L. 
Demostración. Sea t una permutación cualquiera de {1, ..., r}. Entonces 
(TL) (æn, - . - , Arr) = E (Sgn 0) Lloro, » » - y tror) 


= (sgn 7) Y (sgn ro) Llí0ro1, - - - , Qror). 
Como ø recorre (una vez) todas las permutaciones de (1, ..., r}, también lo 
hace tg. Por tanto, 


(r.D(a., . .. , Ar). 


, 0) = (sgn 7)(r,L) (0, . . - 


Así, Tm, L es una forma alternada. 
Si L está en A'(V), entonces L(a,;, ... 
todo ø; luego 7,L = r!L. P 


» Qar) = (Sgn 0) L(9,, ..., 0,) para 


En (5-33) se demostró que la función determinante D en A"(K”) es 


D= mfi Of.) 


donde f,, ...., Jfa son las funciones coordenadas canónicas sobre K”. Hay una 
observación importante que hacer en relación con este último lema. Si K es 
un cuerpo de característica cero, tal que r! es inversible en K, entonces 7 aplica 
M*(V) sobre A'(V). En realidad, en ese caso es más natural desde cierto punto 
de vista usar la aplicación z, = (1/r!)r en vez de z, ya que 7, es una proyección 
de M'(V) sobre A'(V); es decir, una aplicación lineal de M'(V) sobre A'(V) tal 
que 7,(L) = L si, y solo si, L está en A'(V). 


Teorema 7. Sea K un anillo conmutativo con unidad y sea V un K-módulo 
libre de rango n. Si r > n, entonces N(V) = {0}. Si 1 < 1 < n, entonces N'(V) 


es un K-módulo libre de rango (+) 3 


Demostración. 


Un -- 


Sea (B,, ..., Bn} una base ordenada de Y con base dual 
-> fa). Si L pertenece a M'(V), se tiene 


¿Bid Li D ++ Dis 


donde la suma se extiende sobre todos los r-tuples J = (ji, ... 
ros comprendidos entre 1 y n. Si L es alternada, entonces 


LlBio -- 


(5-37) L= Z LBi A 


> ja) de ente- 


Bj) =0 


siempre que dos de los índices j; sean iguales. Si r > n, entonces en cada r-tuple J 
algún entero debe estar repetido. Con lo cual A“(V) = {0} si r > nm. 
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Supóngase ahora que | < r < n. Si L está en A'(V), la suma en (5-37) debe 
extenderse solo sobre los r-tuples J para los que j}, . . ., j, son distintos, ya que 
todos los otros términos son 0. Cada r-tuple de enteros distintos entre 1 y n 
es una permutación de un r-tuple J = (j,, ..., j,) tal que jı < <+- < j,. Este 
tipo especial de r-tuple se llamará una combinación r-aria de (1, ..., n}. Hay 


MN _ n! 
r)  rín—n! 
de tales combinaciones. 


Supóngase que se fije una combinación r-aria J. Sea L; la suma de todos los 
términos en (5-37) que corresponden a las permutaciones de las combinacio- 
nes J. Si ø es una permutación de (1, ..., r}, entonces 


LíBimo - - - s Bin) = (SBD 0) L(Bjo - - >, Bio). 


Con lo que 

(5-38) Ly = L(Bio - - - , Bi) Di 
donde 

(5-39) Dy = Y (sgno) fin Q -++ Q fin 


= fi O + O fa) 
Se ve de (5-39) que cada Dy es alternada y que 
(5-40) L= 3 LíBi...,Bi)Ds 


combinación J 
para todo L de A'(V). La aserción es que las > formas D, constituyen una: 


base de A"(V). Hemos visto que generan A"(V) y es fácil ver que son independien- 
tes. Si Z= (i, ..., ¿Y y J= Gr, ..., j) son combinaciones, entonces 


i, I=, 
srb) =O, TAI 


Supóngase que se tiene para cada combinación un escalar c; y defínase 


L= £ cDy. 
7 


(5-41) DB; - 


De (5-40) y (5-41) se tiene 
cr = L(Biy . - » , Bi). 
En particular, si L = 0, entonces cr = O para cada combinación /. Į 


Corolario. Si V es un K-módulo libre de rango n, entonces N'(V) es un K- 
módulo libre de rango 1. Si T es un operador lineal sobre V, existe un único ele- 
mento c en K tal que 


L(T%, ..., Ton) = CL(01, ..., 0) 
para cada forma n-lineal alternada de L sobre V. 
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Demostración. Si L está en A"(V), entonces evidentemente 
Lr(01, ..., an) = L(Tos,. . ., Tan) 


define una forma n-lineal alternada Ly. Sea M un generador para el rango 1 
módulo A”(V). Todo L en A"(V) es univocamente expresable como L = aM 
para algún a en K. En particular, My = cM para un cierto c. Para L = aM 
se tiene 


Lr = (aM)r 
aMr 
a(cM) 
c(aM) 


cL. I 


Naturalmente, el elemento c del último corolario es llamado el determinante 
de T. De (5-39), para el caso r = n (cuando hay solo una combinación J = 
(1, .... n)), se ve que el determinante de T es el determinante de la matriz que 
representa T en cualquier base ordenada (f,, ..., fB,). Veamos por qué. La 
matriz representante tiene į, j elementos 


Ai = fAT80) 
de modo que 
DATB, - - - , TBa) = È (sgn 0) A(1. 01) -+-+ A(n, on) 


= det A. 
Por otro lado, 
D3(TBn - . - , TBn) = (det T) DICB - - - , Bn) 
= det T. 

La razón de estas observaciones es que, por medio del Teorema 7 y su corolario, 
se obtiene una definición del determinante de un operador lineal que no supone 
el conocimiento de los determinantes de matrices. Los determinantes de ma- 
trices pueden ser definidos en términos de determinantes de operadores, en vez 
de al contrario. 

Queremos decir algo más con respecto a las formas especiales r-lineales 
alternadas D; que se asociaron a una base (f,, ..., fp} de V* en (5-39). Es im- 
portante entender que Dy(a,,. - . , a,) es el determinante de cierta matriz r x r. Si 


Aj =f), 1<i<r1<j<nm 


esto es, si 
a; = Aaßiı + -0 +H Aiba 1<:i<r 


y J es la combinación r-aria (jı, ..., j+), entonces 


(5-42) Dalan - - 1 ar) = Z (sgn 0) AC, ja) -+ - Am Jan) 


4 a,j) + ACL, 4 
= det E : k 


Ami) ==> A i) 
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Así que Dy(0,, ..., 0,) es el determinante de la matriz r x r formada por las 
columnas j}, ..... į de la matriz r x n que tiene (los n-tuples coordenados de) 
%j. .... 0, como sus filas. Otra notación que se usa a veces para este determi- 
nante es 


(5-43) Dalan ---, 05) = SÁ 


En esta notación la demostración del Teorema 7 muestra que toda forma r-lineal — 


alternada L puede expresarse respecto a una base [f,, ..., Ba} por la igualdad 


A £ Il o s 0) y $ 
(5-44) Llan œ) = NGA <i Bin > > >> Bi) Ta Bi) L(Bi ..., Bi). 


5.7. El anillo de Grassman 


Muchas de las propiedades importantes de los determinantes y de las for- 
mas multilineales alternadas se describen mejor mediante una operación de 
multiplicación sobre formas llamada producto exterior. Si L y M son, respec- 
tivamente, formas r- y s-lineales alternadas sobre el módulo V, se tiene un pro- 
ducto asociado a L y K, el producto tensorial L ® M. Esta no es una forma 
alternada, a menos que L = 0 o M = 0; sin embargo, se tiene una manera 
natural de proyectarlo en A"**(V). Parecería que 


(5-45) L- M = rr L ® M) 


fucra la multiplicación «natural» de las formas alternadas. Pero ¿lo es? 
Consideremos un ejemplo concreto. Supóngase que V es el módulo K” 


y que f,,..., Ja sean las funciones coordenadas canónicas sobre K”. Si i + j, 
entonces 


Fi fi = 1:DÍ5) 
es la función (determinante) 
Di ==: 04 — fi Ofi 
dada por (5-39). Supóngase ahora que k es un indice diferente de į y de j. Entonces 
Di -fe = [DÍ — $104) O fi) 
Tf DS DÍ) — midi DÍ DS). 


La demostración del lema que sigue a la ecuación (5-36) muestra que para cual- 
quier forma r-lineal L y para cualquier permutación ø de (1, ..., r} 


Tr (L,) = sgn o r(L) 


Luego, Dij ` fe = 2134, 9 fi O Ja). Por un cálculo semejante f; - Da = 2n3(/, O 
Ji 8 fk). Con lo que 


GiS) Se = fic Gi- fa 
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todo lo cual parece muy prometedor. Pero hay un inconveniente. A pesar del 
cálculo que se ha hecho, la supuesta multiplicación de (5-45) no es asociativa. 
En efecto. si 1 es un índice distinto de los i, j, k, entonces se puede calcular que 


Ds + Dir = Aral $: OÍ O fi DÍ 
y que 


(Di 0) -fi = Ord: Of; DÍ Q fi. 
Con lo que, en general 
Gi I) -Ge Pd A i S) Sd hi 


y se ve que el primer intento de encontrar una multiplicación ha dado una ope- 
ración no asociativa. 

El lector no debe sorprenderse si encuentra más bien fatigoso hacer una 
verificación directa para ver que las dos ecuaciones no son asociativas. Ello es 
típico de la materia, y también es típico que hay un hecho general que simpli- 
fica considerablemente las operaciones. 

Supóngase que Ł es una forma r-lineal y que M es una forma s-lineal sobre 
el módulo V. Entonces 


Tr+o((,L) ® (r,M)) = Tr (2 (sgn o)(sgn 7)L, ® M.) 
= Y (sgn 0)(sgn 7)Tr+s(Le ® My) 
donde ø varía sobre el grupo simétrico, S,, de todas las permutaciones defl..., 
r}, y t varía sobre S,. Cada par o, t define un elemento (9, 1) de S, +, que permu- 


ta los primeros r elementos de (1, ..., r + s} según a, y los últimos s elemen- 
tos según t. Es claro que 


sgn (o, 7) = (sgn 0)(sgn 7) 


(LO Men = Lo O Lo. 


y que 


Por tanto, 


rri[(r,L) O (r.M)] = E sgn (0, 7) trs [L ® Men]. 


Ahora bien, ya se ha observado que 

sgn (o, 7) (LO Min] = Trl L ® M). 
Así, pues, se sigue que 
(5-46) a+ (7,L) O (r,M)] = rist rr LD) M). 


Esta fórmula simplifica numerosos cálculos. Por ejemplo, supóngase que se 
tiene una combinación r-aria I= (i, ..., i) y una combinación s-aria 
J= (jm ---, js). Para simplificar, supóngase, además, que 


AX. << hj<-""" Lje 


j ino 
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Entonces se tienen las funciones determinantes asociadas 
Dx = m,(Er) 
Ds = (Ey) 
donde E; y E, están dados por (5-30). Usando (5-46), se ve inmediatamente que 
Dx + Ds = 4. [rr (Er) ® m(Ey)] 
= ristrr (Er Q Es). 
Como £; Q E, = Er se sigue que 
Dı - Dz = ris! Dius. 
Esto sugiere que la ausencia de asociatividad en la multiplicació 
plicación (5-45) resulta 
del hecho de que D,-D, + Drys- Después de todo, el producto de D, y D, 
debería ser Dry y- Para remediar esta situación, definiremos un nuevo produc- 
to, el producto exterior de una forma r-lineal alternada L y una forma s-lineal 
alternada M por 
(5-47) LAM= a rr (LQ M). 
Se tiene entonces 
Dr AD, = Drys 


para las funciones determinantes sobre K”, y, si es que hay justicia después de 
todo, se ha tenido que lograr la multiplicación apropiada de las formas multi- 
lineales alternadas. Desafortunadamente, (5-47) deja de tener sentido para el 
caso más general en consideración, ya que no es posible dividir por r!s! en el 
anillo K. Si K es un cuerpo de característica cero, entonces (5-47) tiene sentido 
y se puede proceder sin más a demostrar que el producto exterior es asociativo. 


Teorema 8. Sea K un cuerpo de caracteristica cero, y V un espacio vectorial 
sobre K. Entonces el producto exterior es una operación asociativa sobre las for- 
mas multilineales alternadas sobre V. En otras palabras, si L, M y N son formas 
multilineales alternadas sobre V de grados r, s yt respectivamente, entonces 


(LaM)aN=Lna(Man). 


Demostración. De (5-47) se sigue que cd(L a M) = cL a dM para cuales- 
quiera escalares c y d. Luego 


risttl[(LD A M) AN] =ris(L A M) AUN 
y como r.(N) — t!N, se tiene que 
ristl[(L A M) A N] =xr m4 (LQM) A rán) 
1 1 
= Y] a Trioptl ro (L QM) ® r(N)]. 
Por (5-46) se sabe que 
rist[(L A M) A N] = rr (LD M QN). 


Por un cálculo análogo 
rist![L A (M_A N)} = ri (LO MON) 


y, por tanto, (La M)aA N=LA^A(MA^AN). I 

Volvamos ahora al caso general en el que solo se supone que K es un anillo 
conmutativo con unidad. El primer problema es remplazar (5-47) por una de- 
finición equivalente que opere en general. Si L y M son formas multilineales 
alternadas de grado r y s, respectivamente, se construirá una forma canónica 
multilineal alternada L A M de grado r + s tal que 


ris(L A M) = rr(L ® M). 


Recordemos cómo se define 7, ,,(L Y M). A cada permutación a de {1, ... , 
r + s) se asocia la función multilineal 


(5-48) (sgn o)(L Q M). 
donde 


(LO Mala, ---, ary) = (LO M) lan, - - >, Gori) 


y se suman las funciones (5-48) sobre todas las permutaciones o. Hay (r + s)! 
permutaciones; pero como L y M son alternadas, muchas de las funciones 
(5-48) son una misma. En realidad, hay a lo más 


(r +8)! 
ris! 


funciones (5-48) distintas. Veamos por qué. Sea S,+, el conjunto de las permu- 
taciones de (1, ...,r + s}, es decir, sea S,.,, el grupo simétrico de grado r + s. 
Como en la demostración de (5-46), se distingue el subconjunto G que consta 
de las permutaciones ø que permutan los conjuntos (1, ..., r} y ([r+1,..., 
r + s} sobre sí mismos. En otras palabras, ø pertenece a G si 1 < øi < r para 
todo i entre 1 y r. (Necesariamente se sigue que r + 1 < di < r + s para todo 
¡entre r + 1 y r +s.) Ahora G es un subgrupo de S, +s, esto es, si o y t están 
en G, entonces ot”! está en G. Evidentemente, G tiene r!s! elementos. 
Se tiene una aplicación 


Sr $ Mr(V) 


y(0) = (sgn o)(L ® M).. 


definida por 


Como L y M son alternadas 
Y) =LOM 


para todo y en G. Luego, como (Na) = Nto para cualquier forma (r + s)- 
lineal N sobre V, se tiene 


yr) = Plr), —renS,;, yenG. 


lineal 
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Esto dice que la aplicación y es una constante sobre cada clase lateral (a la 
izquierda) tG del subgrupo G. Si 1, y T2 están en S,,., las clases laterales 1,G y 


+ so 


1,6 son idénticas o disjuntas. Cada clase lateral tiene r!s! elementos; luego, hay 
C+»)! 

ris! 
clases laterales distintas. Si S,,./G representa la colección de todas las clases 
laterales, entonces y define una función en S,+s/G; es decir, por lo que se ha 
visto, hay una función Y sobre ese conjunto, de modo que 


vr) = rG) 
para todo t de S,,.. Si H es una clase lateral a la izquierda de G, entonces 
Y(H) = y(t) para todo t de H. 


Se define ahora el producto exterior de las formas multilineales alternadas 
L y M de grados r y s haciendo 


(5-49) LAM=Z}2ġ(H) 
donde H varía sobre S,,,/G. Otro modo de expresar la definición de L a M es 
la siguiente. Sea S cualquier conjunto de permutaciones de (1, ..., r + s} 


que contenga exactamente un elemento de cada clase lateral a la izquierda de 
G. Entonces 


(5-50) LAM= z (sgn o)(L ® M)e 


donde ø varía sobre S. Claro es que 


ris! L A M = m, (L ® M) 


con lo que la nueva definición es equivalente a (5-47) si K es un cuerpo de ca- 
racterística cero. 


Teorema 9. Sea K un anillo conmutativo con unidad y sea V un módulo 
sobre K. Entonces el producto exterior es una operación asociativa sobre las for- 
mas multilineales alternadas sobre V. En otras palabras, si L, M y N son formas 
multilineales alternadas sobre V de grados r, s y t, respectivamente, entonces 


LaM)aN=La(Man). 


Demostración. Aunque la demostración del Teorema 8 no se aplica aquí, 
sí sugiere cómo tratar el caso general. Sea G(r, s, t) el subgrupo de S, ,.,, que 
consta de las permutaciones que permutan los conjuntos 


Dd... t+L...,r+3, F+s+lL...,r+s+0 


sobre sí mismos. Entonces (sgn ¿.1XLQO MON ), es la misma función multi- 
lincal para todos los yu de una clase lateral a la izquierda dada de G(r, s, 1). Se 
escoge un elemento de cada clase lateral a la izquierda de G(r, s, £) y sea E la 
suma de los correspondientes términos (sen ¿(LOMO N), Entonces E es 
independiente de cómo se hayan elegido los representantes x, y 


rist! E = Tri LO MON). 


A AN o 


— AE -Pmk« e 
Determinantes 


M A N) son iguales a E. 
rá, ahora, uw (LAM)ANyYLAl ; ] 
Y Sea Gt + w el subgrupo de S,+s+, que permuta los conjuntos 


Me ori r+s+do or + 9 +0 


si mismos. Sea T cualquier conjunto de permutaciones de (1, ... 


Prk 
elemento de cada clase lateral de G(r + s, t). 


sobre ; 
y + t} que contenga exactamente un 


Por (5-50) (LA M) AN = E (snm [LA M) ON), 


donde la suma se extiende sobre las permutaciones 1 de T. Ahora bien, sea 
Gír, s) el subgrupo de S,+s que permuta los conjuntos 


A r+l...,r+s 


i j i AEEA a 
sobre sí mismos. Sea S cualquier o de permane £ u pde 3 
ada 
nga exactamente un elemento de cada C 1 
Se. SS De (550) y con lo que se ha visto anteriormente, se sigue que 


(LAM)AN= E (sgn o)(sgn 7)[(L O M)e O Ni» 


Bre todos los pares a, t de S x T. Si se conviene 


E i sol as 
donde la suma se extiende s e coincida con g en 
denti E y lemento de S, +s+: QU 
en identificar cada o de S,,, con el ele ica rob S+ f} entonces 


fa r + s}, y sea la identidad en {r +s + l, ... 
(d, as S}, 
se puede escribir 

(L A^ M) AN = 2 sgn (o 7)iL O MON. 


Pero 


[LOM Q N)] = (LO MO Nro. 


ia (L a M) AN = Z sg (r o)(L O MQ Na 


Supóngase ahora que se tiene 
7101 = T202 Y > 
, s, 1). Entonces 17! t, = 17701 ` y COMO 02701 
pa TT Š bin e SN T, están en la misma clase latoia E r 
irh de G(r + s, t). Por tanto, Tı = T2 Y 01 = 027- DR S T a E 
o, y 9, (considerados como elementos de S,,,) pertenece: hnos. + 
lateral de Gír, s); luego a, = 0,. Por tanto, los productos q 


den a los 


(+s+0!(+8)! 


GEO rial 


pares (t, a) de T x S son todos distintos y 
de G(r, s, t). Como hay exactamente 
(r+s+0! 
risti! 


están en distintas clases laterales 
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clases laterales a la izquierda de G(r, s, £)en S, , ,,, se sigue que (L a M) a N= E. 
Por razonamiento análogo, también L ^ (M ^ N)= E. I 


Ejemplo 13. El producto exterior está íntimamente relacionado con cier- 
tas fórmulas para calcular determinantes, conocidas como desarrollos de Laplace. 
Sea K un anillo conmutativo con unidad y n un entero positivo. Supóngase 
que 1 <r < n, y sea L la forma r-lineal alternada sobre K” definida por 


Au -> As 
Llan... , œ) =det| : zok 
ei AT 


Si s=n-—r, y M es la forma s-lineal alternada 


Arr e Am 
Mlan... 0) =det| : : 
Astro "oF As, 


entonces L a M = D, la función determinante sobre K”, Esto es inmediato, 
porque L a M es una forma n-lineal alternada y (como puede verse) 


(LA Mia, ..., €n) = 1. 


Si ahora se describe L a M en forma apropiada, se obtiene un desarrollo de 
Laplace de la función determinante de una matriz n x n sobre K. 

En el grupo de permutaciones S,, sea G el subgrupo que permuta los con- 
juntos (1, ..., r} y {r + 1, .. . „ n} sobre sí mismos. Cada clase lateral a la iz- 
quierda de G contiene precisamente una permutación ø tal que gl <02<:-- 
<or y oalr + 1} <+: < øn. El signo de estas permutaciones está dado por 


sgn o = (—1)01+*+or+(r0—D/2), 
El producto exterior L a M está dado por 
(LA M)(as, . - . , an) = È (sgn 0)L(a0,, . ... , aa)M (ar40 - > - %,) 


donde la suma se toma sobre una colección de o, una de cada clase lateral de G. 
Por tanto, 


(LA Mia, ..., 0) = db es Llais- . - , 0)M(04,, - . - , ak) 
a<- lr 
donde 
es = (Dit +H+re—D/2) 
ki = ot +0). 
En otras palabras, 
Aña o AirljArr ++ Alan 
detA= 3 ej: Ho: : 
ASUS JAn + Ajo Añorga e Arn 


Este es un desarrollo de Laplace. Se pueden obtener otros remplazando los 


—É mi CIO id A AA EA A cds A ds 


Determinantes 179 


conjuntos (1, .... r} y {r + 1, ..., n} por dos conjuntos de índices comple- 
mentarios diferentes. 

Si V es un K-módulo, se pueden reunir las diferentes formas de módulos 
A*(V) y usar el producto exterior para definir un anillo. Por simplificar, se hará 
esto solo para el caso de un K-módulo libre de rango n. Los módulos A'(V) son 
entonces triviales para r > n. Se define 


AV) = AV) DAV) O --- DAV). 


Esta es una suma directa externa —algo de lo que no se ha tratado previamente. 
Los elementos de A(V) son los (n + 1)-tuples (Lo, ..., La) con L, en A'(V). 
Adición y multiplicación por elementos de K se definen como se hace para los 
(n + 1)tuples. Incidentalmente, AY(V) = K. Si se identifica A'(K) con los 
(n + 1)-tuples (0, ..., 0, L, 0, ..., 0) donde L está en A"(K). entonces A'(K) 
es un submódulo de A(V) y la descomposición en suma directa 


AV) = AV) O --- DAY) 


es válida en el sentido corriente. Como A'(V) es un K-módulo de rango (o 


se ve que A(V) es un K-módulo libre y 


rango A(V) = 3, (7) 
= 2” 


El producto exterior define una multiplicación en A(V): Utilicese el producto 
exterior sobre formas y extiéndasele linealmente a A(V). Este producto es dis- 
tributivo con respecto a la adición de A(V) y da a A(V) estructura de anillo. 
Este anillo es el anillo de Grassman sobre V*. No es un anillo conmutativo; 
por ejemplo, si L y M están, respectivamente, en A” y A5, entonces 


LAM = (—1)"M A L. 


El anillo de Grassman es importante en varias partes de la matemática. 


ds A AA AS AA AAA cr AAA A AA, AAA AAA ts A 
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Sea T un operador lineal sobre un espacio V de dimensión n. Si se puede 
encontrar una base ordenada @ = (0,, ..., 0,) de V en la que T se pueda ex- 
presar por medio de una matriz diagonal D (6-1), podrá tenerse más información 
respecto a T. Por ejemplo, números simples asociados con T, tales como el 
rango de To el determinante de T, pueden determinarse fácilmente por la ma- 
triz D. Se pueden expresar explícitamente la imagen y el espacio nulo de T. 
Como [7]g = D si, y solo si, 


(6-2) Tor = ao  k=1,...,n 


6. Formas canónicas 
elementales 


la imagen será el subespacio generado por aquellos a, para los que c, +0, y 
el espacio nulo será generado por los restantes a, . En efecto, parece justo decir 
que si se conoce una base (3 y una matriz diagonal D para la cual [71g = P, 
se podrá responder sin dificultad cualquier pregunta que surja con respecto a T. 

¿Se puede representar todo operador lineal T por medio de una matriz 
diagonal con respecto a alguna base ordenada? Si no, ¿para qué operadores 
T existe una base semejante? ¿Cómo se puede encontrar tal base si existe? Si 
tal base no existe, ¿cuál es el tipo más sencillo de matriz por la cual puede re- 
presentarse 7? Estas son algunas de las preguntas a que se debe responder en 
este (y en el siguiente) capítulo. El tratamiento se hará más complicado a medi- 
da que se vaya viendo cuáles son las dificultades. 


6.1. Introducción 


Se-ha dicho antes que nuestro objetivo principal es el estudio de las trans- 
formaciones lineales sobre un espacio vectorial de dimensión finita. Hasta 
ahora se han dado ejemplos específicos de transformaciones lineales y se han 
demostrado algunos teoremas respecto a las transformaciones lineales generales. 
En el caso de dimensión finita se han empleado bases ordenadas para representar 
tales transformaciones por medio de matrices; y esta representación ha ayu- 
dado a la comprensión de cómo operan. Se ha explorado el espacio vectorial 
L(V, W), que consta de las transformaciones lineales de un espacio en otro, 
y el álgebra lineal L(V, V) que consiste en las transformaciones lineales de un 
espacio en sí mismo. 

En los dos capítulos siguientes se estudiarán los operadores lineales. Nues- 
tro programa se propone seleccionar un operador lineal T sobre un espacio 
de dimensión finita V y «separarlo para ver qué es lo que lo hace importante». 
En esta primera etapa es más sencillo para nuestro propósito usar el lenguaje 
matricial. Vale decir. dado un operador lineal 7, encontrar una base ordenada 
de Y en la que la matriz de T tome una forma especialmente simple. 

He aquí una ilustración de lo que se intenta. Probablemente las matrices 
más sencillas de manejar, fuera de los múltiplos escalares de la matriz unidad, 
son las diagonales 


6.2. Valores propios 


Las observaciones de la introducción sugieren un punto de partida para 
el análisis del operador lineal general T. Se comienza con (6-2), que sugiere 
se estudien los vectores que son transformados por T en múltiplos de sí mismos. 


Definición Sea V un espacio vectorial sobre el cuerpo F y sea T un operador 
lineal sobre V. Un valor propio de T es un escalar c de F tal que existe un vector 
no nulo a. con Ta = ca. Si c es un valor propio de T, entonces 


(a) cualquier a tal que Ta = ca se llama un vector propio de T asociado al 
valor propio c; 


(b) la colección de todos los œ tales que Ta = ca se llama espacio propio 
asociado « c. 


Los valores propios se llaman también a menudo raíces características, 
vigenvalores, valores característicos o valores espectrales. En este libro se usará 


a 0.0 «= 0 c 
O a 0 --- 0 solo el nombre de «valores propios». a 

(6-1) D=loO 0-0) Si T es cualquier operador y c es cualquier escalar, el conjunto de los vec- 
ce Eg o tores x tales que Tx = ca es un subespacio de V. Es el espacio nulo de la trans- 
00.0 è formación lineal (T — cf). Se llama a c un valor propio de T si este subespacio 


es distinto del subespacio nulo, es decir, si (T — cf) no es inyectiva. Si el espacio 
soporte V es de dimensión finita (T — cf), no es inyectiva justamente cuando 
su determinante es distinto de 0. En resumen: 
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Teorema 1. Sea T un operador lineal sobre un espacio V de dimensión finita 
v sea cun escalar. Las siguientes afirmaciones son equivalentes. 


(i) c es un valor propio de T. 
(ii) El operador (T — cl) es singular (no inversible). 
(iii) det (T — cI) = 0. 


El criterio del determinante (iii) es muy importante, porque dice cómo s 
pueden encontrar los valores propios de T. Como det (T — c1) es un polinomio. 
de grado n en la variable c, se determinarán los valores propios como las raices 
de tal polinomio. Se explica esto con más detalle. 

Si @ es cualquier base ordenada de Y y A = [7]g, entonces (T — cl) 
inversible si, y solo si, la matriz (A — c7) es inversible. En consecuencia; 
tiene la siguiente definición. 


Definición. Si A es una matriz n x n sobre el cuerpo F, un valor propio 
de A en F es un escalar c de F tal que la matriz (A — cl) es singular (no inversible), 


Como c es un valor propio de A si, y solo si, det (4 — cf) = 0, o en for- 
ma equivalente, si, y solo si, det (c7 — A) = 0, se puede construir la matri 
(xI — A) con elementos polinómicos y considerar el polinomio f = det (x7 — A). 
En tal caso los valores propios de A en F son los escalares c en F tales que f(c)=0 
Por esta razón a f se le llama el polinomio característico de A. Es importante 
observar que f es un polinomio mónico de grado n. Lo cual es fácilmente com- 
probable por la fórmula para el determinante de una matriz en términos 
sus elementos. 


Lema. Las matrices semejantes tienen el mismo polinomio característico: 


Demostración. Si B = P7*AP, entonces 

det (11 — B) = det (zI — P'AP) 
= det (P-(xI — A)P) 
= det P~ - det (zI — A) - det P 
= det (œI — A). U 


Este lema permite definir el polinomio característico de un operador T 
como el polinomio característico de cualquier matriz n x n que represen! 
a T en alguna base ordenada de V. Al igual que para las matrices, los valores 
propios de T serán las raíces del polinomio característico de T. En particular, 
esto muestra que T no puede tener más de'n valores propios distintos. Es im- 
portante señalar que T puede carecer de valores propios. 


Ejemplo 1. Sea T el operador lineal sobre R? representado, en la ba 
canónica, por la matriz 
E =} 
1 0 


A= 


R CO TS a a 
Formas canónicas Peret ¡red 


El polinomio característico de T (o de A) es 


T 


det (zI — A) = a 


+1 


Como este polinomio tiene dos raíces no reales, T no tiene valores propios. 
Si U es el operador lineal definido sobre C? y representado por A en la base 
ordenada canónica, entonces U sí tiene dos valores propios, i y —i en C. 


Ejemplo 2. Sea A la matriz (real) 3 x 3 


8 1 
2 2 


-1 
al 
22 Q 


Entonces el polinomio característico de A es 


z—-3 —1 1 
-2 2-2 1|= z — 5r? + 8r -— 4 = (z — 1)(æ — 2)? 
—2 —2 z 


Con lo que los valores propios de A son 1 y 2.. 
Supóngase que T es el operador lineal sobre R? representado por A en la 
base canónica. Hállense los vectores propios de T asociados a los valores pro- 


pios 1 y 2. Ahora 
2 1—1 
A-I=|2 1 ~if 
=1 


2 2 
Es inmediatamente obvio que A — 7 tiene rango 2 (y así, pues, T — Z tiene 
nulidad 1). Con lo que el espacio de los vectores propios asociado al valor propio 
1 es unidimensional. El vector a, = (1, 0, 2) genera el espacio nulo de T — I. 
Así que Ta = a si, y solo si, æ es un múltiplo escalar de a,. Sea ahora 


A 
A-2=|2 0 -if 
2 2 - 


Evidentemente, A — 21 también tiene rango 2, así que el espacio de los vectores 
propios asociado al valor propio 2 tiene dimensión 1. Es evidente que Ta = 2a 
si, y solo si, æ es un múltiplo escalar de a, = (1, 1, 2). 


Definición Sea T un operador lineal sobre un espacio vectorial de dimensión 
finita V. Se dice que T es diagonalizable si existe una base de V tal que cada vector 
suyo sea vector propio de T. 


IN A A AA A Aci ci 
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La razón del nombre es clara; en efecto, si existe una base ordenada (8 
{ais - . ., a) de V en la que cada o es un vector propio de 7, entonces la mat 
de T en la base ordenada @ es diagonal. Si Ta, = co; entonces 


a 0 --- 0 
0 O 
a A a 
li 0 --- = 


Por cierto no se requiere que los escalares Ci, +--, €, Sean distintos, incluso 
pueden ser todos iguales (cuando Tes un múltiplo escalar del operador identidad) 

Se podría también definir 7 como diagonalizable cuando los vectores pro- 
pios de T generan V. Esto es solo en apariencia distinto a la definición dada, 
ya que se puede formar una base tomándola de cualquier conjunto generador 
de vectores. 

En los Ejemplos 1 y 2 se han elegido a propósito operadores lineales T sobre 
R" que no son diagonalizables. En el Ejemplo 1 se tiene un operador lineal 
sobre R? que no es diagonalizable, porque no tiene valores propios. En el Ejem- 
plo 2 el operador lineal 7 tiene valores propios; en efecto, el polinomio carac- 
terístico de T se pudo factorizar completamente sobre el cuerpo de los números 
reales: f = (x — 1Ma — 2}. Sin embargo, T no es diagonalizable, pues existe 
solo un espacio unidimensional de vectores propios asociados a cada valor 
propio de 7. Por tanto, no es posible formar una base de R3 con vectores pro- 
pios de T. 

Supóngase que T es un operador lineal diagonalizable. Sean c,, ..., Cp los 
valores propios distintos de T. Entonces existe una base ordenada @ con res- 
pecto a la cual T está representado por una matriz diagonal; es decir, los ele- 
mentos de la diagonal son los escalares ci, cada uno de los cuales se repite un 
cierto número de veces. Si c, aparece repetida d; veces, entonces (se puede dis- 
poner así) la matriz tienc la forma de bloque 


al 0 ... 0 
(6-3) [Th = x al E 


E, MS 


donde 1, es la matriz unidad d; x d;. De esta matriz se observan dos cosas. 


Primero, el polinomio característico de T es producto de factores lineales (posi- 
blemente repetidos): 


f =e — a)* -+ (2 — aja, 


Si el cuerpo escalar F es algebraicamente cerrado, v.g., el cuerpo de los números 
complejos, todo polinomio sobre F Puede ser factorizado (véase Sección 4.5); 
sin embargo, si F no es algebraicamente cerrado, se tendrá una propiedad es- 
pecial de T cuando se diga que sus polinomios caracteristicos tienen tal facto- 


baana TUA 
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rización. Lo segundo que se observa de (6-3) es que d,, el número de veces que 
c; se repite como raíz de f, es igual a la dimensión del espacio de los vectores 
propios asociados al valor propio c;. Ello es así porque la nulidad de una matriz 
diagonal es igual al número de ceros qué tiene en la diagonal principal, y la 
matriz [T — c¡1] gg tiene d, ceros en su diagonal principal. Esta relación entre 

+ la dimensión del espacio propio y la multiplicidad de los valores propios, como 
una raíz de f, no parece ser importante al comienzo; sin embargo, proveerá 
de un medio simple para determinar cuándo un operador dado es diagona- 
lizable. 


Lema. Supóngase que Ta = ca. Si f es cualquier polinomio, entonces 


STi = foja. 


Demostración. Se deja como ejercicio. 


Lema. Sea T un operador lineal sobre un espacio vectorial de dimensión 
finita. Sean C,, . . . , cx los valores propios distintos de T, y sea W, el espacio de los 
vectores propios asociados con el valor característico c. Si W = W, + -`+ + Wy, 
entonces 

dim W = dim W, +--- + dim W. 
En efecto, si GB, es una base ordenada de W,, entonces @ = (@,, . . ., B,) es una 
base ordenada de W. 


Demostración. El espacio W = W, + >+- + Wp es el subespacio genera- 
do por todos los vectores propios de T. Normalmente, cuando se forma la suma 
W de los subespacios W,, se expresa que dim W < dim W, +--> + dim Wa 
por las relaciones lineales que pueden existir entre los vectores de los diferentes 
espacios. Este lema afirma que los espacios propios asociados a los diferentes 
valores propios son independientes uno de otro. 

Supóngase que (para cada i) se tenga un vector f; en W, y supóngase que 
Bı + >>> + Pk = 0. Se demostrará que f; = 0 para cada i. Sea f un polinomio. 
Como Tf, = «pi, el lema anterior dice que 


0 = f(T)0 = (MB + --- + KT)Br 
= f(0)81 + --- +$(0)Br. 


Eligiendo los polinomios f}, . . . , fy de modo que 


Fla) = 0; = fi i=j 


1%]. 
Entonces 
0 = f:(T)0 = Z bbs 
= Bi. 
Ahora sea (3, una base ordenada de W, y sea @ la sucesión @ = (G,,..., Ba). 
Entonces (3 genera el subespacio W = W, +--- + W,- También @ es una 
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sucesión linealmente independiente de vectores, por lo siguiente. Cualquier 
ruración lineal entre los vectores en @ tendrá la forma $, +-*-*+f,_=0, 
donde f; es alguna combinación lineal de vectores en @;. De lo anterior se sabe 
que f; = 0 para cada i. Como cada (3, es linealmente independiente, se ve que 
solo se tiene la relación lineal trivial entre los vectores en GB. f 


Teorema 2. Sea T un operador lineal sobre un espacio vectorial V de di- 
mensión finita. Sean C,, ..., C los valores propios distintos de T y sean W, el 
espacio nulo de (T — c;l). Lo siguiente es equivalente. 


(i) T es diagonalizable. 
(ii) El polinomio característico de T es 


S= = ey (a aj 
y dim W, = d, i=1,..., k. 
(iii) dim W, + --- + dim W, = dim V. 
Demostración. Ya se observó que (i) implica a (ii). Si el polinomio carac- 
terístico f es producto de factores lineales, como en (ii), entonces d, + ++- + d, = 
dim V. En efecto, la suma de los d; es el grado del polinomio característico y 
ese grado es dim V. Por tanto, (ii) implica (iii). Supóngase que se tenga (iii). 
Por el lema, se debe tener que V = W, +-+- + Wp es decir, que los vectores 
propios de T generan V. PP 


El análogo al Teorema 2 para matrices puede formularse en la siguiente 
forma. Sea A una matriz n x n con elementos en un cuerpo F y sean C,, ...., Ch 
los valores propios distintos de A en F. Para cada i, sea W, el espacio de las ma- 
trices columnas X (con elementos en F) tales que 


(A — «IX = 0, 


y sea (3, una base ordenada de W,. Las bases B,, ..., @ẹ se juntan para fo 
la sucesión de columnas de una matriz P: 


P =[P, Pa, ...] = (Gu ..., Gr). 


La matriz A es semejante sobre F a una matriz diagonal si, y solo si, P es una 
matriz cuadrada. Cuando P es cuadrada, P es inversible y P7*AP es diagonal. 


Ejemplo 3. Sea T un operador lineal sobre R? representado en la b; 
ordenada canónica por la matriz 


5 —6 — 
A=|-1 4 2 
3 —6 - 


Se indica cómo se puede calcular el polinomio característico usando sucesi 
operaciones de fila y columna: 


zx— 5 6 6 
1 4 —2 
—3 6 +4; 


ó z—5 6 
== 3183 eos 
= (2 — 2)(2? — 32 + 2) 
= (z — Dz — 1). 


¿Cuáles son las dimensiones de los espacios de los vectores propios asociados 
con los dos valores propios? Se tiene 


4 eT 
A= T= 3 2 
3 -6 — 


3 —6 - 
4-2=|-1 2 2| 
3 e = 


Se sabe que A — 7 es singular y es claro que rango (4 — 1) > 2. Por tanto, 
rango (4 — 1) = 2. Es evidente que rango (4 — 21) = 1. 

Sean W, y W, los espacios de los vectores propios asociados con los valores 
propios 1 y 2. Se sabe que dim W, = 1 y que dim W, = 2. Por el Teorema 2, 
T es diagonalizable. Es fácil obtener una base para R° en que T esté represen- 
tado por una matriz diagonal. El espacio nulo de (7 — I) es generado por el 
vector a, = (3, —1, 3), con lo que [a,) es una base para W,. El espacio nulo 
de T — 21 (es decir, el espacio W,) consta de los vectores (x,, X2, X3) con 
xı = 2x, + 2x3. Así, un ejemplo de una base de W, es 

a = (2, 1,0) 
as = (2,0, 1). 


Si @ = (a,, %2, az), entonces [7]g es la matriz diagonal 


Que T sea diagonalizable quiere decir que la matriz original A es semejante 
(sobre R) a la matriz diagonal D. La matriz P, que permite cambiar las coorde- 
nadas de la base (B a la base canónica, es (claramente) la matriz que tiene las 
transpuestas de a, Az, A como vectores columnas: 
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además, AP = PD, con lo que 


PAAP =D. 


Ejercicios 


1. En cada uno de los siguientes casos, sea T el operador lineal sobre R? representado por 
la matriz A en la base ordenada canónica de R? y sea U el operador lineal en C? repre- 
sentado por A en la base ordenada canónica. Encontrar el polinomio característico de 
T y de U, hallar los valores propios de cada operador y para cada uno de tales valores pro- 
pios c hallar una base para el correspondiente espacio de vectores característicos. 


10 2 3 111 
a=[; oy a=[ i} a-i il 
2. Sea V un espacio vectorial de dimensión n sobre F. ¿Cuál es el polinomio caracterís- 


tico del operador identidad sobre V? ¿Cuál es el polinomio característico para el opera- 
dor cero? 


3. Sea A una matriz triangular n x n sobre el cuerpo F. Demostrar que los valores propios 
de A son los elementos de la diagonal de A, es decir, los escalares A;;. 


4. Sea T un operador lineal sobre R? representado en la base ordenada canónica por la 


matriz 
9 4 4 
—8 3 4f 
—i6 8 7 


Demostrar que 7 es diagonalizable construyendo una base para R?, cada vector de la cual 


es un vector propio de 7. 
6 —3 — 
A=| 4 —1 -2| 
10 —5 - 


5. Sea 
¿Es A semejante, sobre el cuerpo R, a una matriz diagonal? ¿Es A semejante, sobre el cuer- 
po C, a una matriz diagonal? 


6. Sea T el operador lineal sobre R* representado en la base ordenada canónica por la 
matriz 


coa o 
oroo 
ooo 
cocos 


¿En qué condiciones para a. b y c es T diagonalizable? 


7. Sea T un operador lineal sobre el espacio vectorial V de dimensión n y supóngase que 
T tiene n valores propios distintos. Demostrar que T es diagonalizable. 


8. Sean A y B matrices n x n sobre el cuerpo F. Demostrar que si (7 — AB) es inversible, 
entonces 7 — BA es inversible y que 


(I — BAy? = I + B(I — ABJIA. 
9. Usar el resultado del Ejercicio 8 para demostrar que si A y B son matrices n x n sobre 
el cuerpo F, entonces AB y BA tienen los mismos valores propios en F. 
10. Supóngase que A es una matriz 2 x 2 con elementos reales, simétrica (4* = 4). Demos- 
trar que A es semejante, sobre R, a una matriz diagonal. 


11. Sea N una matriz compleja 2 x 2 tal que N? = 0. Demostrar que N = 0 o N es se- 
mejante, sobre C, a 
o 0], 
[i o 


12. Usar el resultado del Ejercicio 11 para demostrar lo siguiente: Si Æ es una matriz 
2 x 2 de elementos complejos, entonces A es semejante, sobre C, a una matriz de uno de 


los dos tipos siguientes: 
É a a o] 
0b i a 


13. Sea V el espacio vectorial de las funciones continuas de R en R; es decir, el espacio 
de las funciones continuas de valor real en el eje real. Sea T el operador lineal sobre V de- 
finido por 


z 

an = [0 a. 
Demostrar que T no tiene valores propios. 
14. Sea A una matriz diagonal n x n de polinomio característico 

(z — c)%-- - (2 — c1)%, 
donde los c,, ..., Cc, son distintos. Sea V*el espacio de las matrices n x n, B, tales que 
AB = BA. Demostrar que la dimensión de V es d? + --- + df. 
15. Sea V el espacio de las matrices n x n sobre F. Sea A una matriz n x n dada sobre F. 
Sea T el operador lineal «multiplicación a la izquierda por A» en V. ¿Tienen A y T los mis- 
mos valores propios? 


6.3. Polinomios anuladores 


Cuando se procura analizar un operador lineal T, una de las cosas más 
útiles de conocer es la clase de los polinomios que anulan a 7. Para precisar, 
supóngase que T es un operador lineal sobre V, espacio vectorial sobre el cuer- 
po F. Si p es un polinomio sobre F, entonces p(T) es también un operador lineal 
sobre V. Si q es otro polinomio sobre F, entonces 


(p + D(T) = p(T) + (T) 
(PD(T) = (MaT). 


Algebra lincal 


http://libreria-universitaria.blogspot.com 


Por tanto, la colección de polinomios p que anulan a T, en el sentido de que 
p(T) =0, 


es un ideal en el álgebra de los polinomios F[x]. Puede ser el ideal cero; es decir. 
puede ser que T no sea anulado por cualquier polinomio no nulo. Pero ello no 
puede suceder si el espacio V es de dimensión finita. 

Supóngase que T es un operador lineal sobre el espacio Y de dimensión n. 
Considérense las primeras (n? + 1) potencias de T: 


LT T,..., T 


Esta es una sucesión de n? + 1 operadores en L(V, V), el espacio de los ope- 
radores lineales sobre V. El espacio L(V, V) tiene dimensión n?. Por tanto, 


la sucesión de los n? + 1 operadores debe ser linealmente dependiente, es decir, 
se debe tener que 


tal H- H eT =0 


para los escalares c;, no todos nulos. En consecuencia, el ideal de polinomios 
que anulan a T tiene un polinomio no nulo de grado n? o menor. 
Conforme al Teorema 5 del Capítulo 4 todo ideal de polinomios consta 
de todos los múltiplos de un cierto polinomio mónico fijo, el generador del 
ideal. Así, pues, al operador T corresponde un múltiplo mónico p con la si- 
guiente propiedad: Si f es un polinomio sobre F, entonces f(T) = 0 si, y solo si. 
f = pg, donde g es algún polinomio sobre F. s : 


Definición, Sea T un operador lineal sobre un espacio vectorial V de di- 
mensión finita sobre el cuerpo F. El polinomio minimal de T es el polinomio móni- 
co generador (único) del ideal de polinomios sobre F que anulan a T. 


El nombre de «polinomio minimal» procede de que el generador de. un 
ideal de polinomios está caracterizado por ser el polinomio mónico de grado 
mínimo en el ideal. Lo cual quiere decir que el polinomio minimal p para el 
operador lineal T está univocamente determinado por estas tres propiedades: 


(1) p es un polinomio mónico sobre el cuerpo escalar. 

(2) p(T) = 0. 

6) Ningún polinomio sobre F que anule. a T tiene grado menor que el 
que tiene p. 


Si A es una matriz n x n sobre F, se define el polinomio minimal de A en for- 
ma análoga, como el único generador mónico del ideal de todos los polinomios 
sobre F que anulan a A. Si el operador T está representado en cierta base or- 
denada por la matriz A, entonces T y A tienen el mismo polinomio minimal. 
Esto es porque f(T) está representado en la base por la matriz f(4), de modo 
que f(T) = 0 si, y solo si, f(A) = 0. i 

De la última observación respecto a operadores y matrices se sigue que las 


a A EA. a l ol a MD. A 
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matrices semejantes tienen el mismo polinomio minimal. Ese hecho resulta 
también evidente de la definición, ya que 


PAP) = PAJAJP 


para todo polinomio f. 

Queremos hacer otra observación respecto a los polinomios minimales de 
las matrices. Supóngase que A es una matriz n x n con elementos en el cuer- 
po F. Supóngase que F, es un cuerpo que contiene a F como subcuerpo. (Por 
ejemplo, A puede ser una matriz con elementos racionales, mientras que F, 
es el cuerpo de los números reales. O A puede ser una matriz con elementos 
reales, mientras que F, es el cuerpo de los números complejos.) Se puede con- 
siderar A como matriz n x n sobre F o como matriz n x n sobre F,. A pri- 
mera vista podría creerse que se obtienen dos polinomios minimales distintos 
para A. Por suerte, ese no es el caso; y debemos ver por qué. ¿Cuál es la defini- 
ción del polinomio minimal para A, considerándola como una matriz n x n 
sobre el cuerpo F? Consideramos todos los polinomios mónicos, con coeficien- 
tes en F, que anulan a A y tomamos el de menor grado. Si f es un polinomio 
mónico sobre F: 

k-1 
(6-4) f= + 2 azi 

j=0 
entonces f(4)= 0 dice simplemente que tenemos una relación lineal entre 
potencias de 4: 


(6-5) Ar + AA ++ A + Gol = O. 


El grado del polinomio minimal es el menor entero positivo k tal que existe 
una relación lineal de la forma (6-5) entre las potencias de /, A, ..., A". Más 
aún, por la unicidad del polinomio minimal, existe para aquel k una, y solo una, 
relación de la forma (6-5); es decir, una vez que el minimal k está determinado, 
existen escalares únicos ap, . . ., az, en F para los que es válido (6-5). Son los 
coeficientes del polinomio minimal. 

Ahora (para cada k) se tiene en (6-5) un sistema de n? ecuaciones lineales 
para las «incógnitas» do, - - . , 4 -1- Como los elementos de A están en F, los 
coeficientes del sistema de ecuaciones (6-5) están en F. Por tanto, si el sistema 
tiene una solución con los ap, . . . , ax 1 EN F,, tiene una solución con los ag, ...., 
ay, en F. (Véase el final de la Sección 1.4.) Está claro ahora que los dos poli- 
nomios minimales son los mismos. 

¿Qué es lo que se sabe hasta ahora con respecto al polinomio minimal de 
un operador lineal en un espacio de dimensión 7? Solo que su grado no excede 
de n?. Pero ésta es una estimación poco aproximada, ya que el grado no puede 
exceder a n. Se demostrará en breve que el operador es anulado por su poli- 
nomio característico. Pero antes queremos observar algo más elemental. 


Teorema 3. Sea T un operador lineal sobre un espacio vectorial V de di- 
mensión n lo sea A una matriz n X n). El polinomio característico y el polinomio 
minimal de T (de A) tienen las mismas raices, salvo multiplicidades. 
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Demostración. Sea p el polinomio minimal de 7. Sea e un escalar. Lo 
se desea demostrar es que p(c) = 0 si, y solo si, e es un valor propio de 7. 
Primero supóngase que p(c) = 0. Entonces 


p = (2 — 0) 


donde q es un polinomio. Como grd q < grd p, la definición del polinom: 


minimal p dice que q(T) + 0. Se elige un vector £ tal que g(T)f$ + 0. Sea x= q(T 
Entonces 


0 = p(T)8 
= (T — cDa(T)8 
= (T — cDa 


y así c es un valor propio de T. 


Supóngase ahora que c es un valor propio de T, o sea Ta = ca, con a +0. 
Como se observó en el lema anterior, 


p(T)a = ple)a. 
Ya que p(T) = 0 y æ # 0, se tiene que p(c) = 0. | 
Sea T un operador lineal diagonalizable y sean Ci, + + -, € ios valores pro- 


pios distintos de 7. Entonces es fácil ver que el polinomio minimal de T es el 
polinomio 


p = (201) -++ (2 — c). 


Si æ es un vector propio, entonces uno de los operadores T — cib 
T — Cil aplica « en 0. Por tanto, 


(T — al) --- (T — aa = 0 


para todo vector propio a. Existe una base para el espacio soporte que consta 
de los vectores propios de T; luego 


p(T) = (T — al) --- (T — al) = 0. 


Lo que concluimos es lo siguiente. Si T es un operador lineal diagonalizable, 
entonces el polinomio minimal de T es un producto de factores lineales dis- 


tintos. Como se verá más adelante, esta propiedad caracteriza los operadores 
diagonalizables. 


Ejemplo 4. Se desea encontrar el polinomio minimal para los operadores 
en los Ejemplos 1, 2 y 3. Se analizarán en orden inverso. El operador del Ejem- 
plo 3 era diagonalizable con polinomio característico 


Í= @ — 1I) — 2). 
Por el párrafo anterior se sabe que el polinomio minimal de T es 


p = @ — 1) — 2). 


El lector podrá verificar directamente que 
(4 —- DA -— 2D) = 0. 


En el Ejemplo 2 el operador T también tiene el polinomio característico 
f = (x — 1)(x — 2}. Pero este T no es diagona lizable, por lo que no se puede 
suber que el polinomio minimal sea (x — 1)(x — 2). ¿Qué es lo que se sabe 
con respecto al polinomio minimal en este caso? Por el Teorema 3 sabemos 
que sus raíces son 1 y 2, permitiéndose algunas multiplicidades. Luego, p se 
debe buscar entre los polinomios de la forma Çx — 1M(x— 2}, k > 1, l> 1. 


Probar (x — 1)(x — 2): 
11 Hi1 -i 
1 —1 2 0 —1 
2 -1 2 2 -2 
| 0 


0—1 
0 
Con lo que el polinomio minimal tiene a lo menos grado 3. Luego se puede 
probar (x — 1} (x — 2) o (x — 1)(x — 2). Como el segundo es el polinomio 
característico, parece ser una elección menos al azar. Se puede en realidad 
calcular que (4 — IMA — 21} = 0. Con lo que el polinomio minimal de T es 
su polinomio característico. ; 
En el Ejemplo 1 se estudió el operador lineal 7 sobre R? representado en 
la base canónica por la matriz 
0 sde 
a[i o) 


El polinomio característico es x? + 1, que no tiene raíces reales. Para deter- 
minar el polinomio minimal hay que olvidarse de T y atender a A. Como una 
matriz compleja 2 x 2, A tiene los valores Propios ¡ y —i. Ambas raíces deben 
figurar en el polinomio minimal. Así el polinomio minimal es divisible por 
x? + 1. Es trivial verificar que A? + Z = 0. Con lo que el polinomio mini- 
mal es x? + 1. 


PON YNN 


(4 — DU — 21) 


Teorema 4 (Cayley-Hamilton). Sea T un operador lineal sobre un espacio 
vectorial V de dimensión finita. Si f es el polinomio característico de T, entonces 
JT) = 0; es decir, el polinomio minimal divide al polinomio característico de T. 


Demostración. Más adelante se darán dos demostraciones más de este 
teorema, independientemente de la que se dará ahora. La presente demostra- 
ción, aunque breve, puede ser difícil de entender, Aparte de lo breve, tiene la 
virtud de dar una clara y nada trivial aplicación de la teoría general de los de- 
terminantes desarrollada en el Capítulo 5. 

Sea K el anillo conmutativo con unidad que consta de todos los polinomios 
en T. Es claro que K es un álgebra conmutativa con unidad sobre el cuerpo 
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escalar. Elijamos una base ordenada (9. .... 0.) para V, y sea A la matri 
que representa a T en esa base dada. Entonces 


Ta; = È, Ajia; PES 
Estas ecuaciones pueden-escribirse en la forma equivalente 
È, CyT — Anla; =0 1<i<n. 
Sea B el elemento de K”*” con elementos 
By = ôT — Ay. 
Cuando n = 2 


ae tal 


det B = (T — Aul(T — AnI) — AygAnl 
im pa (An + An)T + (And — ArAn)I 


donde f es el polinomio característico: 
f= x? — (traza A)x + det A. 
Para el caso n > 2, es también claro que 
det B = f(T) 


ya que J es el determinante de la matriz x/ — A cuyos elementos son los po- 
linomios 


(al — A); = bjx — Aji 


Queremos demostrar que f(T) = 0. Para que f(T) sea el operador cero es 


necesario y suficiente que (det B)a, = 0 para k = 1, .... n. Por la definición 
de B, los vectores a,, . . . , a, satisfacen las ecuaciones 
n 
(6-6) 2, Bija; = 0, 1<i<nm 
ja 


Cuando n = 2, se sugiere escribir (6-6) en la forma 
[2 E] Ani —Anl “aj 0 
—Anl T — Axl jla] [04 
En este caso. la adjunta, adj B, es la matriz 


B- [7-4 Anl 
An! T — Aul 


_fdetB 0 
Bm =[, det B| 


cam [a]- amf] 
-ai 
-13 


En el caso general, sea B = adj B. Entonces por (6-6) 


Luego, se tiene 


n 
2, BuBizas = 0 
FS 

para todo par k, i, y sumando sobre i, se tiene 


0 = 3 BS BuBu; 
iml jml 


x A (3 BuBu) m 
Ahora BB = (det B)I, con lo que 


z BuBu = ôr; det B. 
Por tanto, 
0= 2 ôr;(det B)a; 


= (det Bla 1<k<n. I 


El teorema de Cayley-Hamilton es útil en este momento, fundamentalmente 
porque reduce la búsqueda del polinomio minimal de varios operadores. Si 
se conoce la matriz A que representa T en cierta base ordenada, entonces se 
puede calcular el polinomio característico f. Se sabe que el polinomio minimal 
p divide a f y que los dos polinomios tienen las mismas raíces. No existe mé- 
todo para calcular en forma precisa las raíces de un polinomio (a menos que 
su grado sea bajo); sin embargo, si f está factorizado como 


(6-7) f= (x — c)” --- (x — c",  C;,..., C diferentes, d; > 1 
entonces 
(6-8) p=(x—= cyt a I ey" 1<rj<d; 


Esto es todo lo que se puede decir en general. Si f es el polinomio (6-7) y tiene 
grado n, entonces para cada polinomio p, como en (6-8), se puede encontrar 
una matriz n x n que tiene f como un polinomio característico, y p es su poli- 
nomio minimal. No se demostrará esto ahora. Pero queremos destacar el hecho 
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de que el conocimiento que el polinomio característico tiene la forma (6-7), 
nos dice que el polinomio minimal tiene la forma (6-8), y nada más nos dice 
con respecto a p. 


Ejemplo 5. Sea A la matriz (racional) 4 x 4 


0101 
1010 
A=lo101l 
1010 
Las potencias de A son fácilmente calculables: 
2020 
0202 
r= 
a 2020 
0202 
0404 
4040 
3= . 
A 04.04 
4040 


Así, 4? = 44, es decir, si p = x? = 4x = x(x + 2)(x — 2), entonces p(4) = 0. 
El polinomio minimal, obviamente, no es de grado 1, ya que ello querría decir 
que A es un múltiplo escalar de la unidad. Luego los posibles polinomios míni- 
males son: p, x(x + 2), x(x — 2), x? — 4. Los tres polinomios cuadráticos 
pueden ser eliminados, ya que es inmediatamente obvio que 4? + —24, A? + 24, . 
A? + 41. Por tanto, p es el polinomio minimal de 4. En particular, 0, 2 y —2 
son los valores propios de A. Uno de los factores x, x — 2, x + 2, debe repe- 
tirse dos veces en el polinomio característico. Evidentemente, rango (4) = 2. 
En consecuencia, existe un espacio de vectores propios de dimensión dos aso- 
ciado al valor característico 0. Por el Teorema 2 queda ahora claro que el poli- 
nomio característico es x"(1? — 4) y que A es semejante a la matriz sobre el ' 
cuerpo de los números racionales. 


000 0 
000 0 
002 of 
0 0 0 -2 


Ejercicios 


1. Sea V un espacio vectorial de dimensión finita. ¿Cuál es el polinomio minimal para 
el operador identidad sobre V? ¿Cuál es el polinomio minimal para el operador cero? 


2. Scan a. b y c elementos de un cuerpo F y sea A la siguiente matriz 3 x 3 sobre F: 


00 d 
A=|1 0 bj 
o 1 


DAM A A. A A A A 
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Demostrar que el polinomio característico de A es x? — ax? — bx — c y que éste es tam- 
bién el polinomio minimal de A. 


3. Sea A la matriz real 4 x 4: 


1 ALO 10 
1-1 00 

a -2 —2 21ıf 
Iss L- =100, 


Demostrar que el polinomio característico de A es x"(x — 1Y y que es al propio tiempo 
el polinomio minimal. 


4. ¿Es la matriz A del Ejercicio 3 semejante, sobre el cuerpo de los números complejos, 
a una matriz diagonal? ES 


5. Sea F un espacio de dimensión n y sea T un operador lineal sobre V. Supóngase que 
existe cierto entero positivo k tal que 7* = 0. Demostrar que 7” = 0. 


6. Hallar una matriz 3 x 3 para la cual el polinomio minimal es x?. 


7. Sea n un entero positivo y sea Y el espacio vectorial de los polinomios sobre R que 
tienen a lo más grado n (sin considerar el polinomio 0). Sea D el operador derivación so- 
bre V. ¿Cuál es el polinomio minimal de D? 


8. Sca P el operador en R? que proyecta cada vector sobre el eje x, paralelamente al eje 
vi P(x, y) = (x, 0). Mostrar que P es lineal. ¿Cuál es el polinomio minimal de P? 


9. Sea A una matriz n x n. con polinomio característico 
f=(2—a)%---(2 — eya. 


0d, + `- + xd, = traza (4). 


Demostrar que 


10. Sca V el espacio vectorial de las matrices n x n sobre el cuerpo F. Sea A una matriz 
n x n fija. Sca T el operador lineal sobre V definido por 

T(B) = AB. 
Demostrar que el polinomio minimal de 7 es el polinomio minimal de A. 


I1. Sean A y B matrices n x n sobre el cuerpo F. De acuerdo con el Ejercicio 9 de la Sec- 
ción 6.1. las matrices AB y BA tienen los mismos valores propios. ¿Tienen también el mismo 
polinomio característico? ¿Tienen también el mismo polinomio minimal? 


6.4. Subespacios invariantes 


En esta sección introduciremos algunos conceptos útiles en el estudio de 
un operador lineal. Usaremos estas ideas para obtener descripciones de los 
operadores diagonalizables (y triangulables) en términos de sus polinomios 
minimales. 


Definición. Sea V un espacio vectorial y T un operador lineal sobre V. Si 
W es un subespacio de V, se dice que W es invariante por T si para todo vector a 
de W el vector Ta está en W, es decir, si T(W) está contenido en W. 
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Ejemplo 6. Si T es cualquier operador lineal sobre V, entonces V es in 
riante por T, como también lo es el subespacio nulo. La imagen de 7' y el espaci 
nulo de T son también invariantes por T. 


Ejemplo 7. Sea F un cuerpo y sea D el operador derivación sobre el es- 
pacio F[x] de los polinomios sobre F. Sea n un entero positivo y sea W el sub- 
espacio de los polinomios de grado no mayor que n. Entonces W es invarian 
por D. Esto no es más que otra manera de decir que D es «decreciente en grado», 


Ejemplo 8. He aquí una útil generalización del Ejemplo 6. Sea T un o 
rador lineal sobre V. Sea U cualquier operador lineal sobre Y que conmute 
con T; es decir, TU = UT. Sea W la imagen de U y sea N el espacio nulo de 
U. Ambos W y N son invariantes por T. Si a está en la imagen de U, por ejem- 
plo, a = Uf, entonces Ta = T(UB) = U(TB), de modo que Ta está en la imagen 
de U. Si ú está en N, entonces U(Ta) = T(Ua) = T(0) = 0; luego Tu está en N. 

Un tipo especial de operador que conmuta con T es un operador U = g(T), 
donde g es un polinomio. Por ejemplo, podría tenerse U = T — cf, donde € 
es un valor propio de 7. El espacio nulo de U ya nos es familiar. Se ve que este 
ejemplo incluye el hecho (obvio) de que el espacio de vectores propios de T, 
asociados al valor propio c, es invariante por T. 


Ejemplo 9. Sea T el operador lineal sobre R? representado en la base or- 

denada canónica: por la matriz 
0 —1 

a o) 
Entonces los únicos subespacios de R? que son invariantes por T son R?, y el 
subespacio nulo. Cualquier otro subespacio invariante tendrá necesariamente 
dimensión 1. Pero si W es el subespacio generado por algún vector no nulo a 
que W es invariante por T quiere decir que a es un vector propio, pero A no 
tiene valores propios reales. 

Cuando el subespacio W es invariante por el operador T, entonces T in- 
duce un operador lineal Ty en el espacio W. El operador lineal Tẹ está definido 
por Ty(a) = T(a), para a. en W; pero Tw es un objeto diferente de T, ya que 
su dominio es W y no V. 

Cuando V es de dimensión finita, la invariancia de W por T tiene una in- 
terpretación matricial simple que acaso deba mencionarse aquí. Supóngase: 
que se elige una base ordenada B= (a,, ..., a,) para V tal que B'= (dy, ..., On} 
es una base ordenada de W(r = dim W). Sea A = [T]g de modo que 


n 
Ta; = È Aijai 

i=l 
Como W es invariante por T, el vector Ta; pertenece a W para j < r. Esto quiere 
decir que . 


(6-9) Ta; = z Ajan, j<r. 
i=l 


Formas canônicas el 
En otras palabras, A; = Osi j < rei>r. e A 
Esquemáticamente, A tiene la forma bloque 
B C 
6-10 = 
(E A 0 p) 


donde B es una matriz r x r, C es una matriz r x (n — r) y D es una matriz 
(n — r) x (n — r). El lector deberá observar que, conforme a (6-9), la matriz 
B es precisamente la matriz del operador inducido Tw en la base ordenada GB”. 

Muy a menudo se razonará respecto a T y Ty sin hacer uso de la forma 
bloque de la matriz A en (6-10). Pero deberá observarse cómo surgen ciertas 
relaciones entre Ty y T de esa forma bloque. 


Lema. Sea W un subespacio invariante para T. El polinomio característico 
para el operador restricción Ty divide el polinomio característico de T. El poli- 
nomio minimal de Ty divide al polinomio minimal de T. 


TBC 

4=[5 D] 

donde A = [7] y B = [Tw]g- Por la forma bloque de la matriz 
det (z7 — A) = det (zI — B) det (zI — D). 


Demostración. Se tiene 


Esto demuestra la afirmación respecto a los polinomios característicos. Obsér- 
vese que se usó indistintamente / para representar matrices unidad en tres ta- 
maños diferentes. 

La k-ésima potencia de la matriz A tiene la forma bloque 


ra [|B Ci 
a F D* 


donde C, es alguna matriz r x (n — r). Por tanto, cualquier polinomio que 
anule a A también anula a B (y también a D). Así, el polinomio minimal de 
B divide al polinomio minimal de A. | 


Ejemplo 10. Sea T cualquier operador lineal en un espacio V de dimensión 
finita. Sea W el subespacio generado por todos los vectores propios de T. Sean 
C1» - - + > Cx los valores propios distintos de T. Para cada i, sea W, el espacio de 
los vectores característicos asociados con el valor propio c,, y será (8, una base 
ordenada para W,. El lema anterior al Teorema 2 dice que @' = (GB, ..., G,) 
es una base ordenada de W. En particular, 


dim W = dim W, + --- + dim Wa. 


Sea B'= [a,, ..., a,) de modo que los primeros « forman la base (B,, los 
siguientes, B,, y así sucesivamente. Entonces 


Ta; = tia; i=1l,...,r 
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IEE ar IR Oyo e AA ONGI roi a Ck) con c; repetidos 
dim W; veces. 


Ahora W es invariante por T, ya que para cada a en W se tiene 


a = tia + --- +20 
Ta = tmo + --- + bz, 
Eligiendo otros vectores a, ,,, ..., a, en V tales que Bf = {a;, ..., 0,) seu 


una base para V. La matriz de T, respecto de GB, tiene la forma bloque (6-10), 
y la matriz del operador restricción Ty, respecto de la base @' es 


tí 0 >. 0 
BE 0 l VES o, 
TN rá A 


El polinomio característico de B (es decir, de Ty) es 
g= (2 — a)" ie (a — cx)” 


donde e, = dim W,. Además g divide a f, el polinomio característico de T. 
Por tanto, la multiplicidad de c,, como raíz de f. es a lo menos dim W. 

Todo esto aclara el Teorema 2; dice solamente que T es diagonalizable si, 
y solo si, r = n, si, y solo si, e, + +++ + €; = n. Esto no ayuda mucho para 
el caso no diagonalizable, pues no se conocen las matrices C y D de (6-10). 


Definición. Sea W un subespacio invariante para T, y sea œ un vector de V. 


El T-conductor de « en W es el conjunto Sr(a; W), que consta de todos los poli- 
nomios g (sobre el cuerpo escalar) tales que g(T)u está en W. 


Como el operador T se considera fijo a lo largo de la mayor parte de los 
análisis, se suprimirá normalmente el subíndice T y se escribirá S(u; W). Los 
autores llaman corrientemente a esta colección de polinomios el «relleno» 
(stuffer, en inglés; o das einstopfende Ideal, en alemán). «Conductor» es el tér- 
mino más corriente, preferido por aquellos que piensan en un operador g(T) 
menos agresivo, que suavemente dirige al vector a en W. En el caso especial 
de W = (0), el conductor se llama T-anulador de q. 


Lema. Si W es un subespacio invariante para T, entonces W es invariante 
por todo polinomio de T. Así, pues, para todo o. de V, el conductor Sla; W) es 
un ideal en el álgebra de los polinomios F[x]. 


Demostración. Si ß está en W, entonces Tf está en W. En consecuencia, 
T(TB) = T?f está en W. Por inducción, 7*f está en W para cada k. Formando 
combinaciones lineales se ve que f(T)8B está en W para todo polinomio f. 

La definición de S(a; W) toma sentido si W es un subconjunto de Y. Si W 
es un subespacio, entonces S(u; W) es un subespacio de F[x], ya que 


($ +91) = f(T) + g(T). 


DO. e d 
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Si W es también invariante por T, sea g un polinomio en S(«; W); es decir, 
sea g(T)a. en W. Si f es cualquier polinomio entonces f(T)[g(T)a] estará en W. 
Como 


(NT) = DAT) 


fe está en Sí: W). Con lo que el conductor absorbe la multiplicación por cual- 
quier polinomio. |] 


El generador mónico único del ideal S(a: W) es también llamado T-con- 
ductor de a en W (el T-anulador en caso de que W = {0}). El T-conductor de 
a en W es el polinomio mónico g de menor grado tal que g(T)a está en W. Un 
polinomio f está en S(a; W) si, y solo si, g divide a f. Nótese que el conductor 
S(a; W) siempre contiene el polinomio minimal de T; luego cada T-conductor 
divide al polinomio minimal de T. 4 

Como primera ilustración de cómo usar el conductor S(a; W), se caracteri- 
zarán operadores triangulables. El operador lineal T se llama triangulable si 
existe una base ordenada en la cual T está representado por una matriz triangular. 


Lema. Sea V un espacio vectorial de dimensión finita sobre el cuerpo F. 
Sea T un operador lineal sobre V tal que el polinomio minimal de T sea un pro- 
ducto de factores lineales 


P= (x ea) (aa) Gen F. 
Sea W un subespacio propio de V (W + V) invariante por T. Existe un vector 
a tal que 


(a) a no pertenece a W. 
(b) (T — cDa está en W, para algún valor propio c del operador T. 


Demostración. Lo que dice (a) y (b) es que el T-conductor de a en W es 
un polinomio lineal. Sea f cualquier vector en V que no está en W. Sea g el 
T-conductor de $ en W. Entonces g divide a p, el polinomio minimal de T. Como 
B no está en W, el polinomio g no es constante. Luego 

g = (== a) --- (£ — a) 
donde al menos uno de los enteros e, es positivo. Se elige j de modo que e; > 0. 
Entonces (x — c;) divide a g: 
g = (2 — cj)h. 
Por la definición de g, el vector a = h(T)B no puede estar en W. Pero 
(T — cia = (T — e¿D)MT)8 
= g(T)$ 
pertenece a W. I 
Teorema 5. Sea V un espacio de dimensión finita sobre el cuerpo F y sea 


T un operador lineal sobre V. Entonces T es triangulable si, y solo si, el polinomio 
minimal de T es producto de polinomios lineales sobre F. 


S 
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Demostración. 
la forma: 


Supóngase que el polinomio minimal está factorizado 


p= (z — a)" --- (2 — e)”. 


Por aplicación repetida del lema anterior se llega a una base ordenada 


G= {a ..., a,) en la cual la matriz que representa T es triangular superi 
au An Ci ain 
O an az Oan 

(6-11) [Tlo=|0 0 as an | 
0.0.0 An 

Ahora (6-11) solo dice que 

(6-12) Taj = aya + -> + aga  1<j<n 


esto es, Ta, está en el subespacio generado por %,, ..., a. Para determinar 
los d%, ..., On, se comienza aplicando el lema al subespacio W = (0), para 
obtener el vector a,. Entonces aplicando el lema a W,, el espacio generado por 
%,, Se obtiene a,. A continuación se aplica el lema a W,, el espacio generado 
por a, y 7. Se continúa de este modo. Un punto se merece comentario especial, 
Después que se hayan determinado los a,, ..., a, son las relaciones del tipo 
triangular (6-12) para j = 1, . .. , ¡las que aseguran que el subespacio generado 
por %%;, ...., a, es invariante por T. 

' bs T es triangulable, es evidente que el polinomio característico de T tiene 
a forma 


J= @- a) -+ (2 e)”, 


Basta observar la matriz triangular (6-11). Los elementos de la diagonal 
G11, - «+ > ann SON los valores propios, con c; repetidos d; veces. Pero si f puede 
ser así factorizado, también puede serlo el polinomio minimal, ya que divi- 


daf. I 


cen F. 


Corolario. Sea F un cuerpo algebraicamente cerrado, v.g., el cuerpo de los 
números complejos. Cada matriz n x n sobre F es semejante, sobre F, a una ma- 
triz triangular. 


Teorema 6. Sea V un espacio vectorial de dimensión finita sobre el cuer- 
po F y sea T un operador lineal sobre V. Entonces T es diagonalizable si, y solo si, 
el polinomio minimal de T tiene la forma 


P= (x — ci) e (xX e) 


donde los c,, ..., c, son elementos distintos de F. 


Demostración. Se ha observado anteriormente que, si 7 es diagonalizable, 
su polinomio minimal es producto de factores lineales distintos (véase el análi- 
sis anterior al Ejemplo 4). Para demostrar el recíproco, sea W el subespacio 
generado por todos los vectores propios de T, y supóngase que W + V. Por 


el lema empleado en la demostración del Teorema 5, existen un vector a que 
no está en W y un valor propio c; de T tal que el vector 


B = (T — cia 
pertenece a W. Como f está en W 
B=B+ + +62 


donde Tf, = cpi 1 < i< k y, por tanto, el vector 


MT)8 = HcdBr + -++ + hcr)Br 


está en W, para cada polinomio A. 
Ahora, p = {x — c;)q, para algún polinomio q. También 


q — ales) = (a — c;)h. 
Se tiene 
a(T)a — aleja = MTAT — esa = MIA. 


Pero A(T) está en W, y como 
0 = p(T)a = (T — cI)g(T)a 


el vector q(T)« está en W. Por tanto, q(cj)x está en W. Como a no está en W, 
se tiene q(c;) = 0. Lo cual contradice el hecho de que p tiene raíces distintas. | 


Al final de la Sección 6.7 se dará una demostración diferente del Teorema 6. 
Además de ser un resultado elegante, el Teorema 6 es útil en cuanto al cálculo. 
Supóngase que se tiene un operador lineal T representado por la matriz A en 
cierta hase ordenada, y se desea saber si T es diagonalizable. Se calcula el poli- 
nomio característico f. Si se puede factorizar f: 


f=(2— aj --- (z — e) 


se tienen dos métodos diferentes para determinar si T es diagonalizable o no. 
Un método es ver si (para todo i) se pueden hallar d; vectores propios indepen- 
dientes asociados al valor propio c;. El otro método es comprobar si (T — c,1) >+- 
(T — e, 1) es o no el operador cero. 

El Teorema 5 da una demostración diferente para el teorema de Cayley- 
Hamilton. Ese teorema es fácil para una matriz triangular. De donde, por medio 
del Teorema 5, se tiene el resultado para cualquier matriz sobre un cuerpo al- 
gebraicamente cerrado. Todo cuerpo es un subcuerpo de un cuerpo algebrai- 
camente cerrado. Si se conoce ese hecho se puede tener una demostración del 
teorema de Cayley-Hamilton para las matrices sobre cualquier cuerpo. Si se 
acepta. por último, el teorema fundamental del álgebra (el cuerpo de los nú- 
meros complejos es algebraicamente cerrado), entonces el Teorema 5 da una 
demostración del teorema de Cayley-Hamilton para las matrices complejas, 
y esa demostración es independiente de la dada anteriormente. 


AAA 
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Ejercicios 


1. Sea 7 el operador lineal sobre R? cuya matriz en la base ordenada canónica es 


1 -1 
A= e 
[l ~] 
(a) Demostrar que los únicos subespacios de R? invariantes por T son R? 
pacio nulo, 
(b) Si U es el operador lineal en C?, cuya matriz en la base ordenada canónica es A. 
demostrar que U tiene un subespacio unidimensional invariante. 


y el subes- 


2. Sca w un subespacio invariante para T. Demostrar, sin referirse a las matrices, que 
el polinomio minimal para el operador restricción Ty divide al polinomio minimal de 7: 


3. Sea cun valor propio de T y sea W el espacio de los vectores propios asociados al valor 
propio c. ¿Cuál es el operador restricción Tw? 


4. Sea 
0 10 
4=|2 —2 2| 
—3 2 


¿Es A semejante, sobre el cuerpo de los números reales, a una matriz triangular? Si es así, 
hallar tal matriz triangular. 


5. Cada matriz A tal que 4? = A es semejante a una matriz diagonal. 


6. Sea T un operador lineal diagonalizable sobre un espacio vectorial Y de dimensión 


n y sea wW un subespacio invariante por 7. Demostrar que el operador restricción Ty es 
diagonalizable. 


7. Sea T un operador lineal sobre un espacio vectorial de dimensión finita sobre el cuerpo 
de los números complejos. Demostrar que 7 es diagonalizable si, y solo si, T es anulado 
por algún polinomio sobre C que tiene raices distintas. 


8. Sea T un operador lineal sobre V. Si todo subespacio de Y es invariante por T, enton- 
ces T es un múltiplo escalar del operador identidad. 


9. Sea T el operador integración indefinida 


ana = 10 


sobre el espacio de las funciones continuas en el intervalo [0, 1]. ¿Es el espacio de las fun- 
ciones polinomios invariantes por 7? ¿El espacio de las funciones diferenciables? ¿El es- 
pacio de las funciones que se anulan para x = 3? 


10. Sea A una matriz 3 x 3 de elementos reales. Demostrar que si A no es semejante so- 
bre R a una matriz triangular, entonces A es semejante sobre C a una matriz diagonal. 


I1. ¿Es verdadero o falso que si una matriz triangular A es semejante a una matriz dia- 
gonal, entonces A es diagonal? 


MR. Seca T un operador lineal sobre un espacio vectorial de dimensión finita sobre un cuer- 
po F algebraicamente cerrado. Sea f un polinomio sobre F. Demostrar que e es un valor 
propio de f(T) si, y solo si, c = f(t), donde 1 es un valor propio de T. 


Formas canónica elementales ans 


13. Sea Y el espacio de las matrices n x n sobre F. Sea A una matriz n x n dada, sobre F. 
Sean T y U los operadores lineales sobre Y definidos por 
T(B) = AB 
U(B) = AB— BA. 
(a) ¿Es verdadero o falso que si A es diagonalizable (sobre F), entonces T es diagona- 
lizable? 
(b) ¿Es verdadero o falso que si A es diagonalizable, entonces U es diagonalizable? 


6.5. Triangulación simultánea; 
Diagonalización simultánea 


Sea Y un espacio de dimensión finita y sea $ una familia de operadores 
lineales sobre V. Ocurre preguntar si se pueden triangular o diagonalizar si- 
multáneamente los operadores de $, es decir, cuándo se puede encontrar una 
base @ tal que todas las matrices [7]g, con T en $, sean triangulares (o diago- 
nales). En el caso de la diagonalización, es necesario que $ sea una familia de 
operadores que conmuten: UT = TU, para todo T, U en $. Esto se desprende 
del hecho de que todas las matrices diagonales conmutan. Obviamente es tam- 
bién necesario que cada operador de $ sea un operador diagonalizable. Para 
la triangulación simultánea cada operador en $ debe ser triangulable. No es 
necesario que $ sea una familia de operadores que conmuten; sin embargo, 
esa condición es suficiente para la triangulación simultánea (si cada T es trian- 
gulable individualmente). Estos resultados se desprenden, con ligeras varia- 
ciones, de las demostraciones de los Teoremas 5 y 6. 

El subespacio W es invariante por (la familia de los operadores) $ si W es 
invariante por cualquier operador en $ 


Lema. Sea $ una familia de operadores lineales triangulables de V que 
conmutan. Sea W un subespacio propio de V invariante por $. Existe un vector 
a en V tal que 


(a) a no pertenece a W; 
(b) para cada T en $, el vector Ta está en el subespacio generado por a y W. 


Demostración. No se perderá generalidad si se supone que $ contiene solo 
un número finito de operadores, por la siguiente observación. Sea {7}, ..., T,) 
un subconjunto linealmente independiente maximal de $, es decir, una base 
del subespacio generado por 3. Si a es un vector tal que (b) es válida para todo 
T,, entonces (b) se cumplirá para todo operador que sea combinación lineal 
de los T,, ..., Tp. 

Por el lema anterior al Teorema 5 (este lema es para un operador solo), 
se puede hallar un vector f, (no en W) y un escalar c, tal que (T, — c¡DB, 
esté en W. Sea Y, la colección de todos los vectores fí en V tales que (T, —c,2)B 
esté en W. Entonces V, es un subespacio de V que es propiamente más extenso 
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que W. Además, V, es invariante por $, por tal razón si T conmuta con Ta 
entonces 


(Ti — al )(T8) = T(T, — ae. 


Si f3 está en V,, entonces (T, — c, I)B está en W. Como W es invariante por toda 
T de $, se tiene que F(T, — c,1)fB está en W; es decir. TB en V,, para todo fi 
en V, y todo T en $. 

Ahora W es un subespacio propio de V,. Sea U, el operador lineal en Y, 
que se obtiene restringiendo 7, al subespacio V,. El polinomio minimal de 
U, divide al polinomio minimal de 7,. Por tanto, se puede aplicar el lema an- 
terior al Teorema 5 a tal operador y al subespacio invariante W. Se obtiene 
un vector ß, en V, (no en W) y un escalar c, tal que (T, — Ca1)B, está en W. 
Obsérvese que 


(a) B, no está en W. 
(b) (T, — c,DB, está en W. 
(c) (T, — c¿DB, está en W. 


Sea V, el conjunto de todos los vectores f en V, tal que (T, — c,D)f está 
en W. Entonces V, es invariante por $. Aplíquese el lema anterior al Teore- 
ma 5 a U,, restricción de T} a V,. Si se sigue así se llega a obtener: un vector 
a = f, (no en W) tal que (T; — cjD)a está en W,¡=1,....r. D 

pa 

Teorema 7. Sea V un espacio vectorial de dimensión finita sobre el cuer- 
po F. Sea $ una familia conmutativa de operadores lineales triangulables sobre 
V. Existe una base ordenada de V tal que todo operador de $ está representado 
por una matriz triangular en esa base. 


Demostración. Dado el lema recién demostrado, este teorema tiene la 
misma demostración que la dada para el Teorema 5, si se remplaza T por $. |] 


Corolario. Sea F una familia conmutativa de matrices n x n sobre un cuer- 
po F algebraicamente cerrado. Existe una matriz P, no singular, n x n, con ele- 
mentos en F, tal que P™'AP es triangular superior, para cada matriz A en $. 


Teorema 8. Sea F una familia conmutativa de operadores lineales diago- 
nalizables en el espacio vectorial V de dimensión finita. Existe una base ordenada 


de V tal que todo operador de $ está representado en esa base por una matriz 
diagonal. 


Demostración. Se puede demostrar este teorema usando el lema anterior 
al Teorema 7 para el caso diagonalizable, de igual modo como se adaptó el 
lema anterior al Teorema 5 para demostrar el caso diagonalizable para el Teore- 
ma 6..Sin embargo, a esta altura es más fácil proceder por inducción sobre la 
dimensión de V. 

Si dim V = 1, no hay nada que demostrar. Supóngase que el teorema es 
válido para espacios vectoriales de dimensión menor. que n y sea V un espacio 
vectorial de dimensión n. Elíjase cualquier T en $ que no sea un múltiplo escalar 


de la identidad. Sean c}, . . . , €, los valores propios distintos de T, y (para cada i) 
sea W, el espacio nulo de (T — c,1). Se fija un índice i. Entonces W, es invariante 
por cada operador que conmuta con T. Sea $, la familia de operadores lineales 
en W, que se obtiene por la restricción de los operadores de $ al subespacio 
(invariante) W,. Cada operador de 3, es diagonalizable, porque su polinomio 
minimal divide al polinomio minimal del correspondiente operador en $. Como 
dim W, < dim V, los operadores en $, pueden diagonalizarse simultáneamente. 
Esto es, W; tiene una base (B, que consta de vectores que son simultáneamente 
res propios para cada operador en $,. À 

E Pp Mi lema anterior al Teorema 2 dice que @ = 
(B,, ..., GB) es una base para V. Esa es la base que se buscaba. | 


Ejercicios 


1. Hallar una matriz real inversible P tal que P7*AP y P”*BP sean ambas diagonales, 
donde A y B son las matrices reales 


a E 


-1 
1 1 la 
0) A. E i} ip E i} 
2. Sea $ una familia de matrices complejas 3 x 3 que conmutan. ¿Cuántas matrices 
linealmente independientes puede tener F? ¿Qué se puede decir del caso'n x n? 


ines spaci j ión n y supóngase que T tiene n valo- 
3. Sea T un operador lineal en un espacio de dimensi > 
res propios distintos. Demostrar que todo operador lincal que conmuta con T es un poli: 
nomio en 7. y 


4. Sean A, B, C y D matrices complejas n x n que conmutan. Sea E la matriz 2n x 2n 


A B 
E=le pj 


Demostrar que det E = (4D — BC). 

iti io de las matrices n x n sobre F. 
5. Sean F un cuerpo, n un entero positivo y V el espacio i 
Si A es una matriz n x n fija sobre F, sea T4 el operador lineal sobre V definido por TAB)= 
AB — BA. Considerar la familia de operadores lineales 7, que se obtiene haciendo variar 
A sobre todas las matrices diagonales. Demostrar que los operadores de esa familia son 
simultáneamente diagonalizables. 


6.6. Descomposiciones en suma directa 


Al continuar con el análisis de un operador lineal se deben formular las 
ideas de un modo algo más refinado —-menos en términos de matrices. y más 
en términos de subespacios. Cuando comenzamos este capítulo, describimos 
su propósito del siguiente modo: encontrar una base ordenada en la cual la 
matriz de T tomá una forma especialmente simple. Ahora describiremos nues- 
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tro propósito como sigue: descomponer el espacio base Y en una suma de sub- 
espacios invariantes para T tal que los operadores restricción a esos subespacios 


sean simples. 


i Definición. Sean W,, ..., W, subespacios de un espacio vectorial V. Se 
dice que W,, ..., W, son independientes si 
a+: :+93=0 en”, 
implica que cada a, es 0. 


Para k = 2, el sentido de la independencia es la intersección {0}; es decir, 
W, y W, son independientes si, y solo si, W, N W, = {0}. Sik > 2, la indepen: 
dencia de W,, ..., W, dice mucho más que Wi N-e AN W, = (0). Dice que 
cada W; encuentra la suma de los otros subespacios W; solo en el vector nulo. 

El significado de independencia es el siguiente. Sea Wo +4 el 
subespacio generado por W,, ..., W,. Cada vector u de W puedé ser E 
sado como suma 

a=, +:*::+0%, a en W, 


Si W,, no W, son independientes, entonces esa expresión de « es única; en 
efecto, si 


a=b + tB Bien W, 
entonces 0 = (a, — Ba) + + (0 — Bi), luego œ; — Bi = 0, i= 1, ..., k. 
Así, si W,, .. ., W, son independientes, se puede operar con los vectores de W 


como k-tuples («,, ..., æg), con a, en W; en la misma forma como se opera 
con los vectores de R* como k-tuples de números. 


Lema. Sea V un espacio vectorial de dimensión finita. Sean W,, ..., Wi 


subespacios de V y sea W = W, +-+- + W,. Las siguientes afirmacions son 
equivalentes. i 


(a) W,, .... W, son independientes. 
(b) Para todo j, 2 < j < k, se tiene 


WiN (W, +- + W1) = {0}. 


GE 
(c) Si @; es una base ordenada de W,, 1 < i < k, entonces la sucesión @ = 


(B,, ..., G,) es una base ordenada para W. 

Demostración. Supóngase (a). Sea a un vector de la intersección AN 
(W, + -++ + Wj). Entonces existen vectores %, ..., a; Con a, en Y, ae 
que « = 0, +*** + aj. Como 

a+ +a +a) 4+0+-+-+0=0 
y como W,, ..., W, son independientes, debe tenerse queia, =z 


Aj- =0a0=0, 
Ahora obsérvese que (b) implica a (a). Supóngase 


0= a +:::+0%, a en W. 


Formas canónicas elementales 


Sea j el mayor entero i tal que œ; 4 0. Entonces 
0=0+:*::+2%, a; + 0. 


Así, j= —&;ı — ` — Qj_1, €S un vector no nulo en W¡O(W, +: + W;-1)- 

Ahora que sabemos que (a) y (b) son equivalentes, veamos por qué (a) y (c) 
son equivalentes. Supóngase (a). Sea (8, una base para W,, 1 < i < k, y sea 
@ =(G,, ..., G,). Cualquier relación lineal entre los vectores de @ tendrá 
la forma 


Bat- th= 


donde f, es cierta combinación lineal de los vectores en @;. Como W, ..., Wp 
son independientes, cada ff, es 0. Como cada @; es independiente, la relación 
que tenemos entre los vectores en @ es la relación trivial. 

Se deja la demostración que (c) implica (a) para los ejercicios (Ejercicio 2). B 


Si cualquiera (y, por tanto, todas) de las condiciones del último lema se 
cumple, se dice que la suma W = W, + -+ + W, es directa o que W es la 
suma directa de W,, ..., Wp, y se escribe 


W=W0--0W. 


En la literatura pertinente el lector puede encontrar esta suma directa como 
suma independiente o suma directa interna de W,, ..., Wi. 


Ejemplo 11. Sea V un espacio vectorial de dimensión finita sobre el cuer- 
po F y sea {æ}, ..., On} una base de V. Si W; es el subespacio unidimensional 
generado por a; entonces V = W, @ +- O Wn 


Ejemplo 12. Sea n un entero positivo y F un subcuerpo de los números 
complejos, y sea V el espacio de todas las matrices n x n sobre F. Sea W, el 
subespacio de todas las matrices simétricas, es decir, matrices A tales que 4' = A. 
Sea W, el subespacio de todas las matrices antisimétricas, es decir, matrices 4 


tales que 4' = — A. Entonces V = W, Q W. Si A es cualquier matriz de V, 
la expresión única para A como suma de matrices, una en W, y la otra en W,, es 
A= Ar + Az 
Ar = H4 +4 
A: = HA — A5. 


Ejemplo 13. Sea T cualquier operador lineal sobre un espacio V de di- 
mensión finita. Sean c,, . - -, €% los valores propios distintos de T, y sea W, el 
espacio de los vectores propios asociados a los valores propios c;. Entonces 
W,, - - -, W, son independientes. Véase el lema anterior al Teorema 2. En par- 
ticular, si T es diagonalizable, entonces V = W, @ :::0W,. 


Definición. Si V es un espacio vectorial, una proyección de V es un operador 
lineal E sobre V tal que E? = E. 


Supóngase que E sea una proyección. Sea R la imagen de £ y sea N el es- 
pacio nulo de E. 


1. El vector $ está en la imagen R si, y solo si, EB = f. Si B = Ex, en- 
tonces Ef = Ela = Ea = B. Recíprocamente, si 8 = EP, entonces (natural- 
mente) $ está en la imagen de E. 

2. V=RON. 

3. La expresión única de æ, como suma de vectores en R y en N, es 
a = En + (a — En). 


De (1), (2) y (3) es fácil ver lo siguiente. Si R y N son subespacios de Y tales 
que V = RON, existe un, y solo un, operador proyección E que tiene por 
imagen R y por espacio nulo N. Este operador se llama proyección sobre R según 
o paralelamente a N, 

Cualquier proyección E es (trivialmente) diagonalizable. Si {ais -e 008 


es una base de R y (0,1, ..., an} es una base de N, entonces la base 
@ = (2, ..., 0%) diagonaliza a E: 
_[Z 0 
[Ela = [7 è 


donde / es la matriz unidad r x r, Esto ayudará a explicar parte de la termino- 
logía relacionada con las proyecciones. El lector deberá ver las diferentes si- 
tuaciones en el plano R? (o el espacio tridimensional, R3), para convencerse 
de que la proyección en R, según N, aplica todo vector en R pòr proyección 
paralela a N. 

Las proyecciones pueden ser empleadas para describir las descomposicio- 
nes en suma directa del espacio V. En efecto, supóngase que V = W, 9 ---9) Wy. 
Para todo j se define un operador E; sobre V. Sea a en V, v.g = a +: + Aks 
con a, en W,. Definase Eja = a,. Entonces E; es una ley bien definida. Es fácil 
ver que E; es lineal, que la imagen de E, es W; y que Ef = Ej. El espacio nulo 
de E) es el subespacio 


Wit- + Wi + Wish. +W) 


en efecto, la afirmación de que Eja = 0 solo dice que aj = 0; es decir, que a es 
efectivamente una suma directa de vectores de los espacios W,, con ¡ + j. En 
términos de las proyecciones E;, se tiene 


(6-13) a= Eia + --- + Eya 
para todo a de V. Lo que (6-13) dice es que 
I=E + A 
Obsérvese también que si ¡+ J, entonces E,E, = 0, ya que la imagen de E, es 


el subespacio W;, contenido en el espacio nulo de E,. Se resume ahora lo dicho 
y se enuncia y se demuestra un recíproco. 2 
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Teorema 9. Si V = W, @ --* O Wp, entonces existen k operadores linea- 
les E,, ..., E, sobre V tales que 


(i) todo E, es una proyección (E? = E); 

(ii) EE, =0 si i + j; 

ii) I= E, +++ + E; 

(iv) la imagen de E, es W,. 
Reciprocamente, si E,, ..., E, son los operadores lineales que satisfacen las 
condiciones (i), (ii) y (iii) y si se hace que W, sea la imagen de E,, entonces V = 
Wnes DM. 


Demostración. Solo se necesita probar el recíproco. Supóngase que E,, eo E 
son operadores lineales sobre V que satisfacen las tres primeras condiciones 
y sea W; la imagen de E,. Entonces, claramente 


V=Wi +- +W; 
en efecto, por la condición (iii) se tiene 
a = Fia + --- + Era 
para todo a de V y E;æ está en W;. Esta expresión de a es única, pues si 
a=a+--::+o 


con a, en W,, v.g., a, = E¡f;, entonces, por (i) y (ii) se tiene 


A 
Eja = Y Ejo; 
i=l 


k 
2 E;Eß: 
i=1 


= Ej8; 
= EsB; 
-= Qj. 


Esto muestra que V es la suma directa de los W,. f 


Ejercicios 


i. Sea V un espacio vectorial de dimensión finita y sea W, un subespacio de V. Demos- 
trar que existe un subespacio W, de V tal que V = W, @ W. 


2. Sea V un espacio vectorial de dimensión finita y sean Wi, -.., W, subespacios de Y 
tales que 


V=W+-4W y dimŅY = dim W, + --- + dim Wp 


Demostrar que V = W, @ --- @ W,- 
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3 Hallar una proyección Æ que proyecte R? sobre el subespacio generado por (l, =M) 
segun el subespacio generado por (1, 2). 

4. Sib, y 
una proyecc 


son proyecciones sobr 
¿Es verdadero o falso? 


ubespacios independientes, entonces E, + E en 


5. Si £ es una proyección y f un polinomio, entonces f(E) = al + bE. ¿Qué son u y h 
en términos de los coeficientes de f? 


6. Si un operador diagonalizable tiene solo los valores propios O y I es una proyección. 
¿Es o no cierto? 
7. Demostrar que si E es la proyección de R según N, entonces (/ — E) es la proyección 
en N según R. 
8. Scan £,,..... E, Operadores lineales sobre el espacio V de modo que E, + -+ + E= L 
(a) Demostrar que si E¡E; =0, para i 4 j entonces E? = E,, para cada i. 
(b) En el caso k = 2. demostrar el reciproco de (a). Esto es, si E, + E, = 1, además 
El = E, y El = E, entonces E,E, = 0. 
9. Scan V un espacio vectorial real y E un operador lineal idempotente en V, es decir, 
una proyección. Demostrar que (Z + Æ) es inversible. Hallar (1 + E) '. 


10. Sca F un subcuerpo de los números complejos (o un cuerpo de característica cero). 
Sea Y un espacio vectorial de dimensión finita sobre F. Supóngase que E... ., E, son pro- 
yecciones de V y que E, +-+ + E, = L Demostrar que EE; = 0, para i+ j. (Suge- 
rencia: Usar la función traza y preguntarse qué es la traza de una proyección.) 

1. Sea Y un espacio vectorial, sean W,..... W, subespacios de | y considérese que 


Vi=Wi+ ++ Wat Win + + We 


Supóngase que V = W, O --- @ W,. Demostrar que el espacio dual 1* tiene la descom= 
posición en suma directa V* = V? O ---Q WP. 


6.7. Sumas directas invariantes 


Estamos interesados especialmente en descomposiciones en suma directa 
V=W,0O:::0 W, donde cada uno de los subespacios W, es invariante 
bajo un operador lineal T dado. Dada tal descomposición de Y, T induce un 
Operador lineal 7; sobre cada W, por restricción. El efecto de T es entonces 
el siguiente. Si x es un vector de V, se tienen vectores Únicos %;,. .... %. CON 
a, en W,, de modo que 

azat E a 
y entonces 
Ta = Tiai + --- + Tiar. 


Esta situación se describirá diciendo que T es la suma directa de los operadores 
Ti, ..-, Tp. Al usar esta terminología, debe recordarse que los 7; no son ope- 
radores lineales sobre el espacio V, pero sí sobre los distintos subespacios W. 
El hecho de que V = W, @ : :- O W, permite asociar a cada x en V un k-tuple 
Único (%,, .. ., %) de vectores x, en W, (por x = %, +--+ + 2%) de modo que 
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podamos efectuar las operaciones lineales en V trabajando en Jos subespacios 
individuales W,. El hecho de que cada W; sea invariante por T permite consi- 
derar el efecte de T como efecto independiente de los operadores T, sobre los 
subespacios W,. Nuestro propósito ahora es estudiar 7, encontrando la des- 
composición en suma directa invariante en que los 7; son operadores de una 
naturaleza elemental. Ú 

Antes de ver un ejemplo, observemos el análogo matricial de esta situa- 
ción. Supóngase que seleccionamos una base ordenada (B, para cada W, y sea 
(3 la base ordenada de Y constituida por la unión de las G, dispuestas en el 
orden GKB,...., Bj. de modo que G sea una base para V. Del estudio referente 
al análogo matricial para un subespacio invariante simple, es fácil ver que si 
A = [7]8 y A; = [T,]8,, entonces A tiene la forma bloque 


Ar 0 .. 0 
(6-14) An n 


0 0 --- Az 


En (6-14) A; es una matriz d; x d; (d; = dim W,), y los O son símbolos para los 
bloques rectangulares con escalares O de varias dimensiones. Es también apro- 
piado describir (6-14) diciendo que 4 es la suma directa de las matrices 
ADN PITAR 

Más a menudo describiremos el subespacio W, por medio de las proyec- 
ciones asociadas E, (Teorema 9). Por tanto, se necesita expresar la invarianza 
del subespacio W; en términos de los Æ£;. 


Teorema 10. Sea T un operador lineal sobre el espacio V y sean W,, . . . , Wg y 
Es, . - -, E, como en el Teorema 9. Entonces una condición necesaria y suficiente 
para que cada subéspacio W, sea invariante por T es que T conmute con cada una 
de las proyecciones E,: es decir, 

TE,=ET,  i=1,..., k. 
Demostración. Supóngase que T conmute con cada E,. Sea a en Wj. Enton- 
ces Eja = a. y 
Ta = T(Eja) 
= E;(Ta) 
que muestra que Ta está en la imagen de E}, es decir, que W; es invariante por T. 
Supóngase ahora que todo W; es invariante por T. Se ha de demostrar que 
TE; = ET. Sea æ cualquier vector de V. Entonces 
a = Ea + +++ + Era 
Ta = TEa + --- + TExa. 
Como E;a está en MW, que es invariante por T, se debe tener que T(Eja) = 
para cierto vector f,. Entonces 


E,TE¡a = E¿E4b; 


(e si ij 
VEB; si i=j 
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Con lo que 
E,Ta = E,TEa +++ + ET Ea 
= EsB; 
= TEja. 


Esto vale para cada a de V, o sea E¡T = TE;,. | 


Describiremos ahora un operador diagonalizable T en el lenguaje de las 
descomposiciones en suma directa invariante (proyecciones que conmutan con 
T). Esto será de gran utilidad para entender después unos teoremas de descom- 
posición más profundos. El lector puede pensar que la descripción que se ha 
dade es muy complicada, en comparación con la formulación matricial o la 
simple afirmación de que los vectores propios de T generan el espacio total. 
Pero se debe tener presente que esta es la primera experiencia con un método 
muy efectivo por medio del cual varios problemas concernientes a subespacios, 
bases, matrices y entes similares pueden reducirse a cálculos algebraicos con 
operadores lineales. Con un poco de experiencia, la eficacia y elegancia de este 
método de razonamiento llegarán a ser claras. 


Teorema 11. Sea T un operador lineal sobre un espacio de dimensión finita 
V. Si T es diagonalizable y si cı, ..., cy son los valores propios distintos de T. 
entonces existen operadores lineales E,, ..., Es en V tales que 


(1) T =c E, +***+ CE; 

(ii) I= E, +++ + Ex; 

(ii) EE; = 0, ¿+4 j: 

(iv) E? = E, (E, es una proyección): 

(v) la imagen de E, es el espacio propio de T, asociado a c,. 

Reciprocamente, si existen k escalares distintos Cı, ..., cx y k operadores 
lineales no nulos E,, ..., E, que satisfacen (i), (ü) y (iii), entonces T es diagona- 
lizable, c,, . . . , cy son los valores propios distintos de T y las condiciones (iv) y (v) 
también se cumplen. 

Demostración. Supóngase que T es diagonalizable, con valores propios 
distintos c}, ..., Cy. Sea W, el subespacio de los vectores propios asociados 
al valor propio c; Como se sabe, 

V=W0---QOW. 


Sean E, ..., E, las proyecciones asociadas con esta descomposición, como 
en el Teorema 9. Entonces (ii), (iii), (iv) y (v) se cumplen. Para verificar (1) se 
procede como sigue. Para cada a en V, 
a = Ea + a + Esa 
y asi, 
Ta = TE + --- + TE 
= afia + ++: + Exa. 


En otras palabras, T =C,E, +55 + Cr Er. 


Ahora supóngase que tenemos un operador lineal T junto con escalares 
c; distintos y operadores no nulos E, que satisfacen las condiciones (i), (ii) y (iii). 
Como EE; = 0, cuando į + j, multiplicando ambos miembros de 7 = E, +--> 
+ E, por E; se tiene de inmediato que E? = E,. Muitiplicando T =c,E, + 
+++ + CHE, por E, se tiene entonces que TE, = c,E,, lo que muestra que cada 
vector de la imagen de E, está en el espacio nulo de (T — c;1). Como se ha su- 
puesto que E, + 0, esto demuestra que existe un vector no nulo en el espacio 
nulo de (T — c;f), es decir, que c, es un valor propio de T. Además, los c; son 
todos los valores propios de T; en efecto, si c es otro escalar cualquiera, entonces 


T — cl = (c — OE + --- + (cx — c)Er 


con lo que si (7 — cf ja = 0, se debe tener que (c, — c)E,a = 0. Si a no es el 
vector nulo, entonces Eja + 0, para algún í, con lo que para ese į se tiene que 
q=c=0, 

Ciertamente T es diagonalizable, ya que se ha visto que todo vector no nulo, 
de la imagen de E,, es un vector propio de T, y el que Z = E, + ++- + E, mues- 
tra que estos vectores propios generan V. Todo lo que queda por demostrar 
es que el espacio nulo de (T — cT) es exactamente la imagen de E,. Pero esto 
es evidente, porque si Tx = ca entonces 


k 

R (c; aa 2) Eja =0 

ja 
luego 

(c; — ci)Eja =0 para cada j 

y entonces 

Ea=0, jæi 
Como a = Ex +-+: + Ea y Eja = 0, para j + i, se tiene que « = Ea, lo 
que demuestra que a está en la imagen de E. | 


Una parte del Teorema 9 dice que para un operador diagonalizable T los 
escalares c}, ..., Ck y los operadores E,, ..., £, están univocamente determi- 
nados por las condiciones (i), (ii), (iii), por ser los c; distintos y porque los E; son 
no nulos. Una de las ventajas más notables de la descomposición T = c,E, + 
“++ + (E, es que si g es cualquier polinomio sobre el cuerpo F, entonces 

IT) = g(YEr + --- + g(a1)Es. 


Dejamos los detalles de la demostración al lector. Para ver cómo se demuestra 
debe calcularse 7” para cada entero positivo r. Por ejemplo, 


k k 
T? = X GE; 2 gE; 
fa 


i=l 


k k 
= 2 z cic¡E,E, 
i=1j=1 


k 
= 3H 


k 
= 2 ¿Es 


El lector debe comparar esto con gA) donde A es una matriz diagonal; en ese 
caso g(4) es simplemente la matriz diagonal cuyos elementos de la diagonal 
son 2(Aj1) .... 24m). 


Querríamos en particular hacer notar qué pasa cuando se aplican los poli- 
nomios de Lagrange correspondientes a los escalares te DS 
(2 — ci) 
a 


izj (G — cs) 
Se tiene pj(c¡) = ð; lo que quiere decir que 
k 
p:(T) = 2 dE; 
pæ: 
= E; 
Asi las proyecciones E, no solo conmutan con T. sino que también son poli- 
nomios en T. 
Tales cálculos con los polinomios en T pueden ser usados para dar otra 
demostración del Teorema 6 que caracteriza los operadores diagonalizables 
en términos de sus polinomios minimales. La demostración es enteramente 


independiente de la anterior. 
Si T es diagonalizable. /' =c¡E, +-*=** + c,E,. entonces 


IT) = g(yE + --- + glo) Es 
para todo polinomio g. Así g(T) = 0 si, y solo si, g(c;) = 0, para todo i. En par- 
ticular, el polinomio minimal de T es 
p = (0 — a) --- (£ — cx). 
Ahora supóngase que T sea un operador lineal con polinomio minimal 


P = (x — C1)-=*(x — cx), donde c,, ..., e, son elementos distintos del cuer- 
po escalar. Se forman los polinomios de Lagrange 


e, (a — ci) 
Ri a (c; = ci) 

Recordemos del Capítulo 4 que p;(c;) = ðj y para cualquier polinomio g de 

grado menor o igual a (k — 1) tenemos 


g = glad + --- + gla)pr. 
Tomando g como el polinomio escalar 1 y luego el polinomio x, tenemos 
3 l= pmt H 
6-15 
y ) g =P H ++ + apr 


(El lector advertido notará que la aplicación a x puede no ser válida. pues k 
puede ser 1. Pero si k = 1, T es un múltiplo escalar de la identidad. por tanto. 
diagonalizable.) Ahora sea E; = p;(T). De (6-15) tenemos 


I=E1+-+-+Ex 


Co T = aE + -F Er 


Obsérvese que si ¡+ j, entonces PiP; €s divisible por el polinomio minimal p, 
pues p;p; contiene a cada (x — c,) como factor. Así, 


(6-17) EE¿=0, ižj. 


Debemos notar un aspecto más, a saber, que E, + 0, para todo i. Esto es 
porque p es el polinomio minimal de T y así no podemos tener que p;(T) = 0, 
ya que p; es de grado menor que el grado de p. Este último comentario, junto 
con (6-16), (6-17) y el hecho de que los c; son distintos, permite aplicar el Teo- 
rema 11 para concluir que T es diagonalizable. I 


Ejercicios 


1. Sea £ una proyección de V y sea T un operador lineal sobre V. Demostrar que la ima- 
gen de £ es invariante por T si, y solo si, ETE = TE. Demostrar que ambos, la imagen 
y el espacio nulo de E, son invariantes por 7 si, y solo si, ET = TE. 


2. Sea T el operador lineal sobre R?, cuya matriz en la base ordenada canónica es 


2 1 
0-23. 
Sea W, el subespacio de R? generado por el vector €, = (1, 0). 
(a) Demostrar que W, es invariante por T: 


(b) Demostrar que no existe un subespacio W, que es invariante por T y que es 
complementario de W, : 


R? = W,O Wa 
(Comparar con el Ejercicio 1 de la Sección 6.5). 


3. Sea T un operador lineal sobre un espacio vectorial de dimensión finita. Sea R la ima- 
gen de T y sea N el espacio nulo de T. Demostrar que R y N son independientes si, y solo 
s. V=RON. 


4. Sea T un operador lineal sobre V. Supóngase que Y = W,O:::Q Wp donde cada 
W, es invariante por T. Sea T; el operador inducido (restricción) sobre W,- 

(a) Demostrar que det (T) = det (7,) - - + det (To. 

(b) Demostrar que el polinomio característico de T es producto de los polinomios 
característicos de 7}, ..., Tp- 

(c) Demostrar que el polinomio minimal de T es el mínimo común múltiplo de los 
polinomios minimales de 7,, ..., Tp. (Sugerencia: Demostrar y emplear el hecho corres- 
pondiente para sumas directas de matrices.) 


5. Sea T el operador lineal diagonalizable sobre R? que se examinó en el Ejemplo 3 de 
la Sección 6.2. Usar los polinomios de Lagrange para escribir la matriz representante A 
en la forma A = E, + 26, E, + E = 1, Eik, =0. 


6. Sea A la matriz 4 x 4 del Ejemplo 6 de la sección 6.3. Hallar las matrices E, Es, ES 
de modo que A =c,E, + c,E, + GE, E, + E,+E,=l y EE,=0, ¡+4 j. 


7. En los Ejercicios 5 y 6, obsérvese que (para todo i) el espacio de vectores propios asocia- 
dos con el valor propio c, es generado por los vectores columna de las matrices E;con j # i. 
¿Es una coincidencia? 


http://libreria- 


8. Sea Tun operador lineal sobre V que conmuta con todo operador proyección sobre Y. 
¿Que se puede decir de T? 
9. Sea V el espacio vectorial de las funciones reales continuas sobre el intervalo [-1.1 
del eje real. Sca W, el subespacio de las funciones pares, f(—x) = f(x), y sea W, el subes- 
pacio de las funciones impares, f(—x)= — JU). 

(a) Demostrar que Y = W, ® mw. 

(b) Si T es el operador integración indefinida 


TNA = (10 4 


¿son W, y W; invariantes por T? 


6.8. Teorema de descomposición prima 


Estamos tratando de estudiar un operador lineal T sobre el espacio V de 
dimensión finita, por descomposición de T en suma directa de operadores que 
son en cierto sentido elementales. Esto se puede hacer, en ciertos casos especiales, 
por medio de los valores propios y los vectores propios de T; es decir, cuando 
el polinomio minimal de T se puede factorizar sobre el cuerpo de los escalares 
F como producto de polinomios mónicos distintos de grado 1. ¿Qué se puede 
hacer en el caso del T general? Si se estudia Trusando los valores propios, tene- 
mos dos problemas. Primero, T puede no tener un valor propio simple; esto 
es realmente una deficiencia del campo escalar, a saber: que no es algebraicamente 
cerrado. Segundo, incluso si el polinomio característico se puede factorizar 
completamente sobre F, como producto de polinomios de grado 1, puede ser 
que no haya suficientes vectores propios para T que generen el espacio V; esto 
es, obviamente, una deficiencia de T. La segunda situación queda ilustrada por 
el operador T en F? (F cualquier cuerpo) representado en la base canónica por 


2 0 0 
A=|1 2 ol 
0 0 —1 


El polinomio característico para A es (x — 2} (x + 1) y éste es también el po- 
linomio minimal para A (o para T). Así que T no es diagonalizable. Se ve que 
esto sucede porque el espacio nulo de (T — 27) tiene solo dimensión 1. Por 
otro lado, el espacio nulo de (T + 1) y el espacio nulo de (T — 2I}, juntos, 
generan V, siendo el primero, el subespacio generado por € y el último, el sub- 
espacio generado por €; y €. 

Este será más o menos el método general para el segundo problema. Si (re- 
cuérdese que es una suposición) el polinomio minimal de T se descompone en 


p = (z — a)" --- (2 — e)” 


donde c,, ..., e, son elementos distintos de F, entonces se verá que el espacio 
V es suma directa de los espacios nulos de (T — aly i= 1,..., k. La hipó- 


tesis para p es equivalente al hecho que T es triangulable (Teorema 5); sin em- 
bargo, ese conocimiento no va a ayudar. 

El teorema que se probará es más general de lo que se ha dicho, ya que es 
aplicable para la descomposición prima del polinomio minimal, sean o no sean 
de primer grado todos los factores primos. Le será de provecho al lector pensar 
en el caso especial cuando los factores primos son de grado 1, y aún más par- 
ticularmente pensar en la demostración del tipo proyección del Teorema 6, 
un caso especial de este teorema. 


Teorema 12 (teorema de la descomposición prima). Sea T un operador 
lineal sobre el espacio vectorial V de dimensión finita sobre el cuerpo F. Sea p 
el polinomio minimal de T, 


ES 
donde los p; son polinomios mónicos irreducibles distintos sobre F, y los r; son 
enteros positivos. Sea W; el espacio nulo de p(TY*, i = 1, ..., k. Entonces 


Y/=W0-:0W 

(ii) cada E, es invariante por T; 

(iii) si T; es el operador inducido sobre W, por T, entonces el polinomio mini- 
mal de T, es p;. 


Demostración. La idea de la demostración es la siguiente. Si la descom- 
posición en suma directa (i) es válida, ¿cómo se pueden determinar las pro- 
yecciones E,, ..., E, asociadas a la descomposición? La proyección E, será 
la identidad sobre W, y cero sobre los otros W;. Se encontrará un polinomio 
h, tal que h,(T) es la identidad sobre W; y es cero sobre los otros W;, con lo que 
hi(T)+ -+-+ h(T) = 1, etc. 

Para todo i, sea 

= ? = el 
¿pr 
Como pj, . . ., Pk SOn polinomiales primos distintos, los polinomios fi, .... f 
son primos relativos (Teorema 10, Capítulo 4). Así que existen polinomios 
gı» ---, Ex tales que 


Es =1. 


Nótese también que si į + j, entonces f;f; es divisible por el polinomio p, pues 
ff; contiene a cada pg’ como factor. Se demostrará que los polinomios hi = 
Jigi se comportan del mısmo modo descrito al comienzo de la demostración. 

Sea E, = h(T) = fi(Tẹg(T). Como h, +-+ h = 1 y p divide a ff 
para i + j, se tiene 


E+- +E=I 
E:E; = 0, si ¿Aj 
Con lo que E, son proyecciones que corresponden a una descomposición en 
suma directa del espacio V. Deseamos ahora hacer ver que la imagen de E, es 


O I 


Exactamente el subespacio 4%. Es claro que cada vector de la 
en Wi en efecto, si x está en la imagen de 


P:(T)'a 


nagen de £, está 
E, entonces x = Ea y asi 

= p(T Ea 

po r ar 


lI 


pues 148 es divisible por el polinomio minimal p- Recíprocamente, supóngase 
que a está en el espacio nulo de p;(T}'. Si j = i, entonces fig; es divisible por 
mí. con lo que f:¡(T)g,(T)a = 0, es decir, Eja = 0 para TA R Pero entonces 
es inmediato que Ex = g, es decir, que a: está en la imagen de E,. Esto com- 
pleta la demostración de la parte (i) de la tesis. $e 

Es claro que los subespacios W, son invariantes por T. Si T, es el operador 
inducido en W, por T, entonces evidentemente PTY" = 0, ya Ele: por defini- 
ción, p(T" = 0 en el subespacio W,. Esto muestra.que el polinomio minimal 
de T; divide a pj'. Recíprocamente, sea g cualquier polinomio tal que g(T;) = 0. 
Entonces (TY (T) = 0. Con lo que gf; es divisible por el polinomio minimal F 
de 7'; es decir, pj:f, divide a gf;, Es fácil ver que p;' divide a g. Luego el polino- 


mio minimal de 7, es p. Ẹ 


p Corolario. Si Ey, ..., E, son las proyecciones asociadas a la descomposi- 
ción prima de T, entonces todo E, es un polinomio de T, y en consecuencia, si un 
operador lineal U conmuta con T. entonces U conmuta con cada uno de los E;; 
es decir, cada subespacio W, es invariante por U. e 


Con la notación de la demostración del Teorema 12, consideremos el caso 
especial en que el polinomio minimal de T es un producto de polinomios de 
primer grado; es decir, el caso en que cada p; es de la forma p; = x — c,. Ahora 
la imagen de E; es el espacio nulo W, de (T — c¡I Y". Hágase D =E + + E 
CE Por el Teorema 11. D es un operador diagonalizable que se laa la parte 
diagonalizable de 7. Considérese el operador N = T — D. Ahora 


T= TE, +-:+TE, 
D = afr + -+ + Er 


asi 
N=(T—=aDE +--- 4 (T — aDE,. 
El lector debe estar ya lo suficientemente familiarizado con 
para ver ahora que 
N? = (T ADE +--+ (T lY Ek 
y. en general, que 


las proyecciones 


N = (T = alya + +++ 4 (T — ad Es. 


Cuando r > r; para cada i, se tendrá y 
a > k que N” = 0. ya que el operado =C; 
será entonces 0 en el recorrido de £;. ; á ed 
Definición. Sea N un operador lineal sobre el espacio vectorial V. Se 


ape Ír fusun i dice 
que N es nilpotente si existe un entero positivo r tal que N" =Q 


Teorema 13. Sca T un operador lineal sobre el espacio vectorial V de di- 
mensión finita sobre el cuerpo F. Supóngase que el polinomio minimal de T se 
descompone sobre F, en producto de polinomios lineales. Entonces existen un 
operador diagonalizable D sobre V y un operador N nilpotente sobre V tales que 


ü T=D+N, 
(ii) DN = ND. 


El operador diagonalizable D y el operador nilpotente N están univocamente 
determinados por (i) y (ü), y cada uno de ellos es un polinomio de T. 


Demostración. Acabamos de observar que se puede escribir T = D + N, 
donde D es diagonalizable y N nilpotente, y donde D y N no solo conmutan, 
sino que son polinomios de T. Supóngase ahora que también tenemos T = D' + 
N’, donde D' es diagonalizable, N’ nilpotente y D'N’ = N'D'. Demostrare- 
mos que D= D y N=N". 

Como D' y N’ conmutan entre sí y T = D' + N', se ve que D' y N’ con- 
mutan con T. Así, D' y N’ conmutan con cualquier polinomio de 7; luego 
conmutan con D y con N. Ahora tenemos 


DEN=D'+N' 


D-D'=N'-N 


y todos estos cuatro operadores conmutan entre sí. Como D y D' son ambos 
diagonalizables y conmutan, son simultáneamente diagonalizables, y D — D' es 
diagonalizable. Como N y N’ son nilpotentes y conmutan, el operador (N' — N) 
es nilpotente; en efecto, como N y N’ conmutan 


w- ny = 3, (7) many 


y así, cuando r es suficientemente grande, cada término en esta expresión de 
(N' — NY será 0. (En realidad un operador nilpotente en un espacio de dimen- 
sión n debe tener su potencia n-ésima 0; si se hace arriba r = 2n, será suficien- 
temente grande. Se sigue entonces que r = n es suficientemente grande, pero 
esto no es obvio en la expresión anterior.) Ahora D — D' es un operador dia- 
gonalizable y también nilpotente. Un tal operador es evidentemente el opera- 
dor cero, pues como es nilpotente, el polinomio minimal de este operador es 
de la forma x” para algún r < m; pero entonces, como el operador es diagona- 
lizable, el polinomio mínimal no puede tener raíces repetidas; luego r = 1 y 
el polinomio minimal es simplemente x, lo que dice que el operador es 0. Con 
lo que se tiene que D=D'y N=N'. | 


Corolario. Sea V un espacio vectorial de dimensión finita sobre un cuerpo 
F algebraicamente cerrado, v. g., el cuerpo de los números complejos. Entonces 
todo operador lineal T sobre V puede escribirse como suma de un operador diago- 
nalizable D y un operador nilpotente N que conmutan. Estos operadores D y N 
son únicos y cada uno es un polinomio de T. 


Por estos resultados se ve que el estudio de los operadores lineales en 
Espacio vectorial sobre un cuerpo algebraicamente cerrado queda esencialmente 
reducido al estudio de operadores nilpotentes. Para espacios vectoriales sob: 
cuerpos no algebraicamente cerrados se debe encontrar todavía un sustituto d 
los valores y vectores propios. Es un hecho muy interesante que estos dos pros 
blemas pueden tratarse en forma simultánea, y ello es lo que se hará en el prós 
ximo capitulo. 

Para concluir esta sección queremos dar un ejemplo que ilustre algunas 
de las ideas del teorema de descomposición prima. Hemos preferido darlo al 
final de la sección, ya que se refiere a ecuaciones diferenciales y, por tanto, no 
es exclusivamente de álgebra lineal. 


Ejemplo 14. En el teorema de descomposición prima no es necesario que 
el espacio vectorial V sea de dimensión finita, ni es necesario para las partes 
(i) y (ii) que p sea el polinomio minimal de T. Si T es un operador lineal sobre 
un espacio vectorial arbitrario y si existe un polinomio mónico p, tal que 
P(T) = 0, entonces las partes (i) y (ii) del Teorema 12 son válidas para T con 
la demostración que se ha dado. 

Sea n un entero positivo y sea V el espacio de todas las funciones f n veces 
continuamente derivables sobre el eje real y que satisfacen la ecuación diferencial 


š d? (cd df 
(6-18) H pan ZS + q af =0 
donde los ap, ..., a,-, son constantes dadas. Si C, representa el espacio de 


las funciones n veces continuamente derivables, entonces el espacio V de las so- 
luciones de esta ecuación diferencial es un subespacio de C,. Si D representa 
el operador derivación y p es el polinomio 


p = a E + -o H aag H o 
entonces V es el espacio nulo del operador p(D), ya que (6-18) no dice más que 
PID) = 0. Por tanto, V es invariante por D. Considérese ahora D como un 
operador lineal sobre el subespacio V. Entonces pD) = 0. 
Si estamos considerando funciones derivables de valores complejos, enton- 


ces C, y V son espacios vectoriales complejos, y Ag, - - . , 4-1 puede ser cualquier 
número complejo. Escribimos ahora 


p = (£ — a)” --- (£ — o)” 


donde los c,, .. . , cz son números complejos distintos. Si W; es el espacio nulo 
de (D — c¿IY*, entonces el Teorema 12 dice que 


V=W0---OW. 


Es decir, si f satisface la ecuación diferencial (6-18), entonces f queda unívoca- 
mente determinado en la forma 


P=ht--+hñ 


donde las f satisfacen la ecuación diferencial (D — c;IYf; = 0. Así el estudio: 


de las soluciones de la ecuación (6-18) queda reducido al del espacio de solu- 
ciones de una ecuación diferencial de la forma 

(6-19) (D — elf = 0. 

Esta reducción se ha efectuado por los métodos generales del álgebra lineal, 
es decir, por el teorema de descomposición prima. 

Para describir el espacio de soluciones de (6-19), se debe conocer algo res- 
pecto a las ecuaciones diferenciales; esto es, se debe conocer algo respecto a 
D. además del hecho de que es un operador lineal. Es muy fácil demostrar, 
por inducción sobre r, que si f está en C,, entonces 

(D — clyf = eD (ef) 
esto es, 
d 
A gO = ete, ete. 

Asi, (D — cIYf = 0 si, y solo si, D'(e”“f) = 0. Una función g tal que D'g = 0, 
es decir, dg/dr = 0, debe ser una función polinomio de grado (r — 1) o menor 

gÀ) = bo + bit + ++ + brat. 
Así que f satisface (6-19) si, y solo si, tiene la forma 

SA = (do + bit + «++ + brt’). 


En consecuencia, las «funciones» e", te", ..., te generan el espacio de 
soluciones de (6-19). Como 1, t, ..., 17 * son funciones pa indepen- 
dientes, y la función exponencial no tiene ceros, estas r funciones te", 0 <j < 
r — 1, forman una base del espacio de soluciones. 
Volviendo a la ecuación diferencial (6-18), que es 
p(D)f = 0 
p = (a) -- (1 a)” 


se ve que las n funciones 1"e',0<m<rj,=1,1<j< k, forman una base del 
espacio de soluciones de (6-18). En particular, el espacio de soluciones es de 
dimensión finita y tiene dimensión igual al grado del polinomio p. 


Ejercicios 


1. Sea T un operador lineal sobre R? representado en la base ordenada canónica por la 


matriz 
6.3 - 
á 4 —1 =1 
10 —5 — 
Expresar el polinomio minimal p de T en la forma p = p,p,, donde p, y p2 e mt 
mónicos e irreducibles sobre el cuerpo de los números reales. Sea W, el espacio nulo de 


PAT). Hallar las bases @; para los espacios W, y W2. Si T; es el operador inducido en W; 
por T, hallar la matriz de T, en la base (B, (anteriormente citada). 


2. Sea Tel operador lineal sobre R’ representado por la matriz 


31 —1 
2 2 -I 
2 O. 


en la base ordenada canónica. Demostrar que existen un operador diagonalizable D sobre 
R°? y un operador nilpotente N sobre R? tales que T=D+N y DN = ND. Hallar las 
matrices de D y N en la base canónica, (No hay más que repetir la demostración del Teore- 
ma 12 para este caso especial.) 


3. Si V es el espacio de los polinomios de grado menor o igual que n sobre un cuerpo F, 
demostrar que el operador derivación sobre V es nilpotente. 


4. Sea T el operador lineal sobre el espacio V de dimensión finita con polinomio carac- 
terístico 


J=(2—oJt--. (a — ej 
y polinomio minimal 


Pp= (2 a)n... (z — cq)ra, 


Sea MW, el espacio nulo de (T — cy”. 

(a) Demostrar que W; es el conjunto de todos los vectores æ de V tales que (7 — clY'a=0 
para algún entero positivo m (que dependerá de a). 

(b) Demostrar que la dimensión de W, es di. (Sugerencia: Si T, es el operador inducido 
cn W, por T, entonces T} — c,l es nilpotente; asi el polinomio característico de T; — c,1 
debe ser x“, donde e, es la dimensión de W, (¿demostración ?); así el polinomio caracte- 
rístico de T; es (x — c)“: ahora úsese el hecho de que el polinomio característico de T es 
el producto de los polinomios característicos de los 7;, para demostrar que e; = d,.) 


5. Sea V un espacio vectorial de dimensión finita sobre el cuerpo de los números comple- 
jos. Sca T un operador lineal sobre V y sea D la parte diagonalizable de 7. Demostrar que 
si g es cualquier polinomio con coeficientes complejos, entonces la parte diagonalizable 
de g(T) es g(D). 


6. Sea V un espacio vectorial de dimensión finita sobre el cuerpo F y sea T un operador 
lincal sobre T tal que rango (7) = 1. Demostrar que o bien 7 es diagonalizable o bien Tes 
nilpotente, pero no ambas cosas simultáneamente. 


7. Sea Vun espacio vectorial de dimensión finita y sea Tun operador lincal sobre V. Supón- 
gase que T conmuta con cada operador lineal diagonalizable en Y. Demostrar que T es 
un múltiplo escalar del operador identidad. 


8. Sea V el espacio de las matrices n x n sobre el cuerpo F y sea A una matriz dada n x n 
sobre F. Se define un operagor lineal T sobre V por T(B) = AB = BA. Demostrar que si 
«4 es una matriz nilpotente, T es un operador nilpotente. 


9. Dar un ejemplo de dos matrices nilpotentes 4 x 4 con el mismo polinomio minimal 
{necesariamente tienen el mismo polinomio característico), pero que no son semejantes. 
10. Sea T un operador lineal sobre el espacio V de dimensión finita, sea p= -d 
polinomio minimal de T y sea V = W -OW la descomposición prima de Eyes 
decir, W, es el espacio nulo de PTY. Sea W cualquier subespacio de V invariame por T. 
Demostrar que 


W=WOWewmrnwe:-:.- WNW). 


11. ¿Cuál es el error en la siguiente demostración del Teorema 137 Supóngase que el Re 
ias minimal de 7 sea un producto de factores lineales. Entonces, por el TAr a 
T es triangulable. Sea @ una base ordenada tal que A = [7]g es triangular superior. 


D la matriz diagonal con elementos en la diagonal principal a,;, ..., am- Entonces A = 


D + N, donde N es estrictamente triangular superior. Evidentemente, N es nilpotente. 
12. Si se meditó en el Ejercicio 11, pensar nuevamente en él, después de observar qué 
dice el Teorema 7 respecto a las partes diagonalizable y nilpotente de 7. 

13. Sea T un operador lineal Y con polinomio minimal de la forma p" con p irreducible 
A el cuerpo de los escalares. Demostrar que existe un vector a en V tal que el T-anu- 
lador de a es p”. El 

14. Usar el teorema de descomposición prima y el resultado del Ejercicio 13 para T 
ia lo siguiente. Si T es cualquier operador lineal sobre un espacio V de Am inita, 
entonces existe un vector x en Y con T-anulador igual al polinomio minimal de 7. 

15. Si N es un operador lineal nilpotente sobre un espacio de dimensión n, entonces el 
polinomio caracteristico de N es x”. 


7. Las formas racional 
y de Jordan 


7.1. Subespacios cíclicos y anuladores 


Sea nuevamente V un espacio vectorial de dimensión finita sobre un cuer- 
po F y sea T un operador lineal dado (pero arbitrario) sobre V. Si a es cualquier 
vector de V, existe un subespacio mínimo de Y que es invariante por T y que 
contiene a a. Este subespacio se puede definir como la intersección de todos 
los subespacios invariantes por T que contienen a a; sin embargo, es más útil 
por el momento ver las cosas del siguiente modo. Si W es un subespacio de 
V invariante por T y que contiene a a, entonces W debe contener también al 
vector Tæ; luego W debe contener a 7(Ta) = T%a, T(T?x) = Tu, etc. Esto 
es, W debe contener a g(T)x para todo polinomio g sobre F. El conjunto de 
todos los vectores de la forma g(T)a, con g en F[x], es evidentemente invariante 
por T, y es así el menor subespacio invariante por T que contiene a a. 


Definición. Si a es cualquier vector de V, el subespacio 7-cíclico generado 
por x es el subespacio Z(«; T) de los vectores de la forma g(T)a, g en F[x]. Si 
Zla; T) = V entonces se dice que a es un vector cíclico de T. 


Otro modo de describir el subespacio Z(a; T) es que Z(a; T) es el subespacio 
generado por los vectores T*«, k > 0; y así a. es un vector cíclico de T si, y solo si, 
estos vectores generan V. Se previene al lector que el operador general T no 
ticne vectores cíclicos. 


Ejemplo 1. Para cualquier T, el subespacio T-cíclico generado por el vec- 
tor nulo es el subespacio nulo. El espacio Z(a; T) es de dimensión uno si, y solo 
si, a es un vector propio de T. Para el Operador identidad, todo vector no nulo 
genera un subespacio cíclico unidimensional; así, si dim Y > 1, el operador 
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identidad no tiene vector ciclico. Un ejemplo de operador que tiene un vector 
ciclico es eb operador lineal 7 sobre F? que está representado en la base orde- 


vida canónica por la matriz 
o 01 
10 


Aqui el vector cíclico (un vector cíclico) es e, ; en efecto, si R = (a, b), entonces 
con g = a + hy se tiene f = g(T)e,. Para este mismo operador el subespacio 
ciclico generado por €, es el espacio unidimensional generado por €,. pues €, 
es un vector propio de T. 
Para cualquier T y x sean las relaciones lineales 
ca + aa + --- + aTa = 0 


entre los vectores T’z. esto es. se consideran los polinomios g = co + ex +s 

+ eë que tienen la propiedad de que g(T)x = 0. El conjunto de todos los 
g en F(x] tales que g(7)2 = 0 es claramente un ideal en F[x]. Es también un 
ideal no nulo. va que contiene al polinomio minimal p del operador T(p(TY=0 
para todo z de 1). 


Definición. Si x es cualquier vector de V. el T-anulador de x es el ideal M(x; T) 
en F[x] que consta de todos los polinomios g sobre F de modo que g(Tja = 0. 
11 polinomio mónico único p, que genera este ideal se le llamará también el T- 
anulador de >. 


Como se observó anteriormente. el T-anulador p, divide al polinomio mi- 
nimal del operador T. El lector debe observar también que grd (p,) > 0. salvo 
que z seu el vector cero. 


Icorema L. Seu z un vector no nulo en V y sea p, el T-anulador de 2. 


D El grado de p, es iguel a la dimensión del subespacio cíclico Z(x; T). 
(11) Si el grado de p, es k. entonces los vectores x, Ta. T?a. .... TY 'x 
torman una base de Zx: T). 
(ii) Si U es el operador lincal en Ztxz. T) inducido por T. entonces el poli- 
nomio minimal de U es p,. 
Demostración. Sea g un polinomio sobre el cuerpo F. Se escribe 
9= Pq tr 


donde r = 0 o grd (r) < grd 1p,) = k. El polinomio p,q está en el T-anula- 
dor de x. y asi 


g(T)a = r(T)a. 


Como r = 0 o grd (r) < k. el vector r(T Y es combinación lineal de los vecto- 
E es AS eZ y como g(7 )xz es un vector típico en Z(x: T). esto muestra 
que estos Á vectores generan Z(x: T). Estos vectores son. en efecto. linealmente 
independientes. va que cualquier relación lineal no trivial entre ellos dará un 


O AS a. 
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polinomio g no nulo tal que g(T)x = 0 y grd (g) < grd (p,), que es absurdo. 
Esto demuestra (i) y (ii). 

Sea U el operador lineal en Z(a; T) que se obtiene por restricción de T a 
ese subespacio. Si g es un polinomio sobre F, entonces 


pUY(T)a = palT)9(T)a 
= g(T)pa(T)a 
= g(T)0 
=0. 


Así, el operador p,(U) aplica cada vector de Z(«; T) en O y es el operador cero 
en Z(a; T). Además, si h es un polinomio de grado menor que k, no se puede 
tener A(U) = 0; en efecto, entonces h(U)a = h(T)a = 0, que contradice la 
definición de p,. Esto demuestra que p, es el polinomio minimal de U. Ẹ 


Una consecuencia particular de este teorema es la siguiente. Si sucede que 
a es un vector cíclico para T, entonces el polinomio minimal de T debe tener 
igual grado que la dimensión del espacio V; luego el teorema de Cayley-Hamilton 
dice que el polinomio minimal de 7 es el polinomio característico de T. Se de- 
mostrará más adelante que para cualquier 7 existe un vector a en Y que tiene 
al polinomio minimal de T por anulador. Se deducirá entonces que T tiene 
un vector cíclico si, y solo si, los polinomios minimal y característico de T son 
idénticos. Pero ello tomará algún trabajo antes de poderlo ver. 

El plan es estudiar el T general usando operadores que tienen un vector cí- 
clico. Para ello se considera un operador lineal U, sobre el espacio V de dimen- 
sión k, que tiene un vector cíclico a. Por el Teorema 1 los vectores a, . . ., U! 
forman una base del espacio W, y el anulador p, de a es el polinomio minimal 
de U (y entonces, también el polinomio característico de U). Si se hace a, = U' a, 
i = 1,...,k, entonces la acción de U sobre la base ordenada BG = [a,,..., ap} es 


(7-1) Uai = Qi+1, i=1...,k-1 


Uar = — coo — Ca — ==" — Cak 


donde p = co + cix +=": + Ck-1 + xP. La expresión para Ua, se desprende 
del hecho de que p,(U)x = 0, es decir, 
Uta + cr1U'tla + +++ + aUa + ca = 0. 
Esto dice que la matriz de U, en la base ordenada @, es 


0 so E a 
1 --- 0 —a 

(7-2) 0 ms 0 —a 
0 w i e 


La matriz (7-2) se llama la matriz asociada al polinomio mónico p,. 


Teorema 2. Si U es un operador lineal sobre un espacio de dimensión fini- 
ta W, entonces U tiene un vector cíclico si, y solo si, existe una base ordenada 


Las formas racional y de Jordan 229 


de W en la que U esté representada por la matriz asociada al polinomio mini- 


mal de U. 


Demostración. Antes se observó que si U tiene un vector cíclico, entonces 
existe tal base ordenada de W. Recíprocamente, si se tiene una base ordenada 
fais -... 2k} de W en la que U esté representada por la matriz asociada a su 
polinomio minimal, es obvio que a, es un vector cíclico de U. | 


Corolario. Si A es la matriz asociada a un polinomio mónico p, entonces p 
es el polinomio minimal y el polinomio característico de A. 


Demostración. Una manera de demostrarlo es hacer que U sea el operador 
lineal sobre F*, representado por 4' en la base ordenada canónica, y aplicar 
el Teorema 1 junto con el teorema de Cayley-Hamilton. Otro método consiste 
en usar el Teorema 1 para ver que p es el polinomio minimal de A y verificar 
por un cálculo directo que p es el polinomio característico de A. Ẹ 


Un último comentario: si 7 es un operador lineal cualquiera sobre el espa- 
cio V y a es un vector de V, entonces el operador U que T induce en el subes- 
pacio cíclico Z(a; T) tiene un vector cíclico, que es a. Así, Z(a; T) tiene una base 
ordenada en la cual U está representado por la matriz asociada de p,, T-anu- 
lador de a. 


Ejercicios 


1. Sea T un operador lineal sobre F?. Demostrar que un vector no nulo, que no es un 
vector propio de 7, es un vector cíclico de 7. Demostrar luego que o T tiene un vector ci- 
clico o T es un múltiplo escalar del operador identidad. 


2. Sea T el operador lineal sobre R* representado en la base ordenada canónica por la 


matriz 
20 0 
E 2 o| 
0 0 -1 


Demostrar que T no tiene vector cíclico. ¿Cuál es el subespacio T-ciclico gencrado por el 
vector (1, —1, 3)? 


3. Sea T el operador lineal sobre C? representado en la base ordenada canónica por la 


matriz 
la ,0 
E 2 =} 
0 1 1 


Hallar el 7-anulador del vector (1, 0, 0). Hallar el 7-anulador de (1, 0, ¿). 


4. Demostrar que si 7? tiene un vector cíclico, entonces T tiene un vector cíclico. ¿Es 
verdadero el recíproco? 


5. Sea Y un espacio vectorial de dimensión » sobre el cuerpo F y sea N un operador lineal 


A AA 
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nilpotente sobre Y. Supóngase que N" 1.40 y sca a un vector cualquiera de Y de modo 
que A* lo + 0. Demostrar que a es un vector cíclico de N. ¿Cuál es exactamente la matriz 
de N en ka base ordenada (a, Na, ..., N" 10)? 
6. Dar una demostración directa de que si 4 es la matriz asociada al polinomio móni- 
co p, entonces p es el polinomio característico de A. 
7... Sea Y un espacio vectorial de dimensión n y sea T un operador lineal sobre V. Supóngase 
que T es diagonalizable. 
(a) Si T tiene un vector cíclico, demostrar que T tiene » valores propios distintos. 
(b) Si T tiene n valores propios distintos, y si (%;, . . . Œn} es una base de vectores pro- 
pios de T. demostrar que a =0, +-** +a, es un vector cíclico de T. 


8. Sea T un operador lineal sobre el espacio vectorial V de dimensión finita. Supóngase 
que 7 tiene un vector cíclico. Demostrar que si U es un operador lineal cualquiera que con- 
mute con 7, U es un polinomio de 7. 


7.2. Descomposiciones cíclicas - 
y forma racional 


El objeto de esta sección es demostrar que si T es un operador lineal arbi- 
trario sobre un espacio V de dimensión finita, entonces existen vectores %,,..., 0 
en V tales que 


‘V = Zla; T) ® --: OZ(a,; T). 


En otras palabras, queremos demostrar que V es una suma directa de subes- 
pacios T-ciclicos, ło cual mostrará que T es la suma directa de un número finito 
de operadores lineales, cada uno de los cuales tiene un vector cíclico. El efecto 
de esto será reducir muchos problemas acerca del operador lineal general a 
problemas análogos con un operador que tiene un vector cíclico. El teorema 
que se demostrará (Teorema 3) es uno de los resultados más profundos del 
álgebra lineal y tiene muchos corolarios interesantes. 

El teorema de la descomposición cíclica está estrechamente relacionado 
con el siguiente problema, ¿Qué subespacios W, invariantes por T, tienen la 
propiedad de que existe un subespacio W’, invariante por T, tal que V= WOW"? 
Si W es cualquier subespacio de un espacio Y de dimensión finita, entonces 
existe un subespacio W' tal que V = W @ W”. En general hay muchos de tales 
subespacios W” y cada uno de ellos se llama complementario de W. Se pregunta. 
¿cuándo un subespacio invariante por T tiene un subespacio complementario 
también invariante por 7? 

Supóngase que Y = W @ W’, donde W y W’ son invariantes por T, y véase 
entonces qué se puede descubrir respecto al subespacio W. Cada vector ff de 
V es de la forma f = y + y”, donde y está en W y y en W”. Si f es un polinomio 
sobre el cuerpo de los escalares, entonces 


SD) = ST)y + ST. 
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Como W y W’ son invariantes por T, el vector f(T), está en W y f(T} está 
en W”. Por tanto, J(7)f está en W si, y solo si, f(T)y" = 0. Lo que interesa es 
el hecho, aparentemente sin importancia, de que si f(T)f está en W, enton- 


ces MDP = AT). 


Definición. Sea T un operador lineal sobre un espacio vectorial V y sea W un 
subespacio de V. Se dice que W es T-admisible si 

(i) W es invariante por T; 

(ii) si f(T) está en W, existe un vector y en W tal que f(T) = (TY. 

Como acabamos de mostrar, si W es invariante y tiene un subespacio in- 
variante complementario, entonces W es admisible. Una de las consecuencias 
del Teorema 3 será el recíproco, de modo que la admisibilidad caracterizará 
aquellos subespacios invariantes que tienen subespacios invariantes comple- 
mentarios. 

Indiquemos cómo la propiedad de la admisibilidad está implicada en la 
intención de obtener una descomposición 


V = Z(œ; T) 0 ::- O Zla; T). 
El método básico para llegar a tal descomposición será seleccionar los vec- 


tores &;, . . ., %, por inducción. Supóngase que, por un proceso u otro, se hayan 
seleccionado 4, ..., Aj Y que 


W; = Zla; T) + -+ + Zla; T) 
sea un subespacio propio. Se desea encontrar un vector no nulo a; + | tal que 
W; N Zla; T) = (0) 


porque el subespacio W;+ı = W; ® Z(aj+ı; T) será entonces al menos una 
dimensión más cercana al espacio V que se descompone. Pero ¿por qué debe 
existir tal vector j+? Si %,, ..., aj, han sido elegidos de modo que W; sea 
un subespacio T-admisible, entonces es relativamente fácil ver que se puede 
encontrar un a+, adecuado. Esto es lo que hará posible la demostración del 
Teorema 3, aun cuando no expresemos así el razcnamiento fraseado. 

Sea W un subespacio propio invariante por 7. Se desea encontrar un vec- 
tor a, no nulo, tal que 
(7-3) W N Zla; T) = (0). 
Se puede elegir un vector f que no está en W. Considérese el T-conductor S(B; W), 
que consta de todos los polinomios g tales que g(T)f está en W. Se recuerda 
que el polinomio mónico f = s(f; W) que genera el ideal S(f; W) es llamado 
también el T-conductor de f en W. El vector f(T)f está en W. Ahora, si W es 
T-admisible, existe un y en W con f(T) = N(T)y. Sea a = f — y y sea g un 
polinomio cualquiera. Como f — y está en W, g(T)f estará en W si, y solo si, 
g(T)a está en W; en otras palabras, S(x; W) = S(f: W). Con lo que el poli- 
nomio f es también el T-conductor de a en W. Pero f(T)a = 0. Ello dice que 
g(T)a está en W si, y solo si, g(T)a = 0; es decir, los subespacios Z(a; T) y W son 
linealmente independientes (7-3) y f es el T-anulador de g. 
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Teorema 3 (teorema de descomposición ciclica). Sea T un operador lineal 
sobre un espacio vectorial de dimensión finita V y sea Wọ un subespacio propio 
T-admisible de V. Existen vectores no nulos @;, ..., 9, en V con T-anuladores 
FOSPCCIitOS Pis ---, Py, tales que 


li) V = W @ Zia: T)O0:::0 Zœ; T); 
(10) py divide a po, k = 2, coca T. 


Más aún, el entero r y los anuladores py, ..., p, están univocamente determi- 
nados por (i), (iì) y el hecho de que ninguno de los a, es 0. 


Demostración. La demostración es bastante larga, razón por la cual la 
«dividiremos en cuatro partes. Para la primera lectura parece más fácil tomar 
Wa = (0), aun cuando no produzca una simplificación sustancial. En toda 
la demostración se abreviará f(T)B por ff. 

Parte 1. 


Existen vectores no nulos Bi, ..., P, en V tales que 


(a) V= W + Zli; T) + ++ ZB T); 
(b)sil<k<r y 


W, = Wo + Zibi: T)+ + ZiB T) 


entonces el conductor py = (Bi; W,_,) tiene el grado máximo entre todos los 
T-conductores en el subespacio W,_,; es decir, para todo k 
grd p; = max grd s(a: W, ,) 
zenb 
Esta parte depende solo del hecho de que W, es un subespacio invariante. 
Si W es un subespacio propio invariante por T, entonces 


0 < max grd s(a; W) < dim Y 


y se puede elegir un vector f$ de modo que grd s(f$; W) alcance tal máximo. El 
subespacio W + Z(ß; T) es entonces invariante por T y tiene dimensión mayor 
que dim W. Aplicando este proceso a W = W, se tiene Bi. Si Wi = Wo + 
ZIP; T) es aún propio, entonces aplicando el proceso a W, se obtiene B2. Se 
continúa de esta forma. Como dim W, > dim W,_,, se debe alcanzar W, = Y 
en no más de dim V etapas. 

Parte 2. Sean Pi, ..., B, vectores no nulos que satisfacen las condiciones 
(a) y (b) de la parte 1. Se fija k, 1 < k < r. Sea B un vector cualquiera de Y y 
sca f = s(P; W,_1). Si 


JB = Bo + pa y gb, 
entonces f divide a cada polinomio g; y Bo = fyo, donde y, está en Wo. 


Si k = 1, ello es justamente la afirmación de que W, es T-admisible. Para 
demostrar la afirmación para k > 1, se aplica el algoritmo de la división: 


(7-4) gi = fhi + fi 1 =0 6 


Bi en W; 


grd r; < grd f. 


Queremos mostrar que +, = O para todo i. Sea 
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(15) 1=8- E hb 
Como y — ß está en Wp, 

(y; Wi) = s(B; Wi) = f- 
Además. 
(1-6) fr = + E rb 


Supóngase que algún 7; es distinto de 0. Se llegará a una contradicción. Sea j el 
mayor índice į para el que r; + 0. Entonces 


El 
(7-7) fr =Bo+ 2 Tibi, iD. y grd r; < grd f. 
Sea p = s(y: W;_1). Como W,-, contiene a W;_ ,, el conductor f = s(y; Wg-1) 


debe dividir a p: 


p = fg. 
Aplicando g(T) a ambos miembros de (7-7): 
(7-8) pY = gfy = griB; + gBo ER griBs. 


Por definición, py está en W;..,, y los dos últimos términos del segundo miem- 
bro de (7-8) están en W);_ ,. Por tanto, gr;f, está en W;_ ,. Ahora, por la condi- 
ción (b) de la parte 1: 


grd (gr;) > grd s(B;; W;_1) 
= grd pj 
> grd s(y; W),_,) 
= grd p 
= grd (/g). 


Con lo que grd r; > grd f, y ello contradice la elección de j. Se sabe ahora que 
f divide a cada g; y luego que fp = fy. Como W, es T-admisible, Bo = fYo, 
donde ; está en Wọ. De paso notamos que la parte 2 es una reafirmación de 
la observación de que cada uno de los subespacios W,, W,, ..., W, es T-ad- 
misible. 


Parte 3. Existen vectores no nulos œ, ..., 0, en V que satisfacen las con- 
diciones (1) y (ii) del Teorema 3. 
Se comienza con los vectores f}, .... f,. como en la parte 1. Fijo k, 


1 <k<r, se aplica la parte 2 al vector $ = f, y al T-conductor f = pp- 
Obtenemos 


(7-9) Pix = PrroH+ E prhiBi 
1<i<k 
donde yọ está en Wọ y los h,, ..., Ag- son polinomios. Sea 
(7-10) a=Bb= vw È hbi 
1<i<k 
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Como fp — 2, está en Hoy. 


(7-11) slar; Wi-1) = s(Br; Wr) = pe 


y COMO MX = 0, se tiene 
(7-12) Wr N Zla; T) = {0}. 


Como cada % satisface (7-11) y (7-12), se sigue que 


W: = Wo® Zla; T) O --- O Zla; T) 


y que P es el T-anulador de x. En otras palabras, los vectores %,..... 
finen la misma sucesión de subespacios W,, W,, . . . que los Nestares Br i saafi 
los T-conductores Pk = sl: W, 1) tienen las mismas propiedades maximalés 
[condición (b) de la parte 1]. Los vectores %;,..... x, tienen además la propie- 
dad de que los subespacios Wo, Z(x,: T). Zíx,: T), ... son independientes 
Es, por tanto, fácil verificar la condición (ii) en el Teorema 3. Como p,%, = 0 
para todo i, se tiene la relación trivial ib 


Prak = 0 + pai + + + Praa. 


E E la parte 2 con los Br, - --, Pk remplazados por los gi. .... Xx y con 
B = a, se tiene como conclusión que p, divide a cada p,. con i< k. 


Parte 4. El número r y los polinomios py, . 
terminados por las condiciones del Teorema 3. 

Supóngase que además de los vectores aj, .... x, en el Teorema 3, se tengan 
vectores no nulos yy..... 7, con los respectivos T-anuladores g,...., g, tales que 


V=WOZMTO--- O Zr; T) 
gr divide 9-1) k= 2, ...,8 


Pp, están univocamente de- 


(7-13) 


Se ES dl fic que r = s y que p; = g; para todo i. 

s fácil ver que p, = g,. El polinomio g, está determinado por (7-13 
el T-conductor de V en Wọ. Sea S(V; W,) la colección de o: AE 
que ff esté en Wo para cada f en V; es decir, los polinomios f tales que la ima 
gen de fiT) esté contenida en W,. Entonces S(V; Wo) es un ideal no nulo cn 
el álgebra de los polinomios. El polinomio g, es, por esta razón, el generador 
mónico de ese ideal. Todo f de V tiene la forma 


B= Botfint + fiy: 
y así, 
mB = gipo + È firi 


Como cada g; divide a g,, se tiene que g,;, = 0 para todo i y g,f$ = g,f, está 
en W,. Con lo que g, está en S(V: Wo). Como g, es el polinomio riónico dé 
menor grado que aplica ;, en Wọ, se ve que g, es el polinomio mónico de menor 
grado en el ideal S(V: Wo). Por el mismo razonamiento, p, es el generador 
de tal ideal, con lo que p; = g,- 


T 


ys 
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Si f es un polinomio y W es un subespacio de V, usaremos la expresión 
abreviada /W para el conjunto de todos los vectores fa con z en W. Se deja 
para los ejercicios la demostración de los siguientes tres hechos: 

t: SZ TM = Za TI. 

2 SiV=V,0:::0 Vp donde cada V; es invariante por T, entonces 
IE = foogt fie 

3. Six y y ticnen el mismo 7-anulador, entonces fa y f; tienen el mismo 
T-anulador y (por tanto) 


dim Z(fa; T) = dim Z(fy; T). 
Ahora se procede por inducción para ver quer = syp; = £, Para EU 

El razonamiento consiste en contar las dimensiones en la forma correcta. Se 
dará la demostración de que si r > 2, entonces pz = £,. y COn ello la inducción 
será clara. Supóngase que r > 2. Entonces 

dim Wo + dim Z(a1; T) < dim V. 
Como se sabe que p, = gi. se sabe que Z(x,: T) y Zi: T) tienen la misma 
dimensión. Por tanto. 

dim Wo + dim Z(yı; T) < dim V 
lo que muestra que + > 2. Ahora tiene sentido preguntarse si cabe O no p,= 82. 
De las dos descomposiciones de Y se obtienen dos descomposiciones del subes- 
pacio pl: 


Il 


Pp WoO Z(pa; T) 
Wo ® Zn T) ® +++ O Z(pavs; T). 

Hemos usado los hechos (1) y (2) anteriores y el hecho de que pz%; = 0, 
¡> 2. Como se sabe que p, = gi. (3), anteriormente mencionado, dice que 
Zip: T) y Zip. T) tienen la misma dimensión. Luego se desprende de 
(7-14) que 


PV 


(7-14) ny 


[l 


dim Z(pavi; T) = 0, i> 2. 


Concluimos que p>;, = 0 y que g, divide a pz. El razonamiento puede inver- 
tirse para demostrar que p, divide a g}. Por tanto, pz = £2- |] 


Corolario. Si T es un operador lincal sobre un espacio vectorial de dimensión 
finita. entonces todo subespacio T-admisible tiene un subespacio complementario 
que es también invariante por T. 

Demostración. Sea Wo un subespacio admisible de Y. Si Wọ = V, el com- 
plemento que se busca es (0). Si Wo es propio, se aplica el Teorema 3 y se hace 
Wi = Zla; T) O --- O Z(a,; T). 

Entonces Wg es invariante por T y V = WO wo | 


Corolario. Sca T un operador lincal sobre un espacio vectorial V de dimen- 
sión finita. 
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(a) Existe un vector a en V tal que el T-anulador de z% es el polinomio 
minimal de T. 

(b) T tiene un vector ciclico si, y solo si, los polinomios característico y mi 
nimal de T son idénticos. 


Demostración. Si V = (0), los resultados son trivialmente verdaderos. Si 
V + 10), sea 


(7-15) V = Zla; T) ® --- ® Zla; T) 


donde los T-anuladores p,, . . . , p, son tales que p,-, divide a pp, 1 < k < r — 1. 
Como observamos en la demostración del Teorema 3, se sigue fácilmente que 
Pı es el polinomio minimal de 7, es decir, el T-conductor de Y en {0}. Con ello 
se ha demostrado (a). 

Vimos en la Sección 7.1 que si T tiene un vector cíclico el polinomio mini- 
mal de T coincide con el polinomio característico. El contenido de (b) está en 
el recíproco. Se elige un a cualquiera, como en (a). Si el grado del polinomio 
minimal es dim V, entonces V = Z(a; T). J 


Teorema 4 (teorema de Cayley-Hamilton generalizado). Sea T un opera- 
dor lineal sobre un espacio vectorial V de dimensión finita. Sean p y f los poli- 
nomios minimal y característico de T, respectivamente. 


(i) p divide a f; 


(ii) p y f tienen los mismos factores primos, salvo multiplicidades. 
(iii) Si 


(7-16) PER E 
es la factorización prima de p, entonces 
Wam) IAE e 


donde d, es la nulidad de K(TY* dividida por el grado de f. 


Demostración. No se considera el caso trivial V = {0}. Para demostrar 
(i) y (ii) se considera una descomposición cíclica (7-15) de V, que se obtiene 
del Teorema 3. Como observamos en la demostración del segundo corolario, 
Pı = p. Sea U; la restricción de Ta Z(œ;; T). Entonces U, tiene un vector cícli- 
co, y así p; es el polinomio minimal y el polinomio característico de U;. Por 
tanto, el polinomio característico f es el producto f =p,,..., P,- Esto es evi- 
dente por la forma bloque de (6-14) que la matriz de T toma en una base apro- 
piada. Evidentemente, p, = p divide a f, y ello demuestra (i). Es claro que cual- 
quier divisor primo de p es divisor primo de f. Reciprocamente, un divisor 
primo de f = p, > + - p, debe dividir a uno de los factores p; que a su vez divi- 
de a pj. 

Sea (7-16) la factorización prima de p. Se emplea el teorema de descompo- 
sición prima (Teorema 12 del Capítulo 6) que dice que, si V; es el espacio nulo 
de f(T)", entonces 


(7-18) V=V0---OV 


SR C — -— e a 
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y fi’ es el polinomio minimal del operador 7;, obtenido por restricción de T al 
subespacio (invariante) V,. Se aplica la parte (ii) del presente teorema al opera- 
dor 7;,. Como su polinomio minimal es una potencia del primo f;, el polinomio 
característico de T, tiene la forma f*, donde d; > r; Evidentemente 


a dim Y, 
graf 
y (casi por definición) dim V, = nulidad f(T)*. Como T es la suma directa de 
los operadores T,, ..., 7}, el polinomio característico f es el producto 
f=- fe | 


Corolario. Si T es un operador lineal nilpotente sobre un espacio vecto- 
rial de dimensión n, entonces el polinomio característico de T es x". 


Se desea ver ahora el análogo del teorema de descomposición cíclica para 
matrices. Si se tiene el operador T y la descomposivión en suma directa del 
Teorema 3, sea @; la «base ordenada cíclica» 

A Tuto} 


para Z(a,; T). Aquí k; representa la dimensión de Z(a,; T), esto es, el grado 


«del anulador p;. La matriz del operador inducido 7; en la base ordenada GB, es 


la matriz asociada del polinomio p,. Así, si se hace que (3 sea la base ordenada 
de Y que es la unión de las 63, dispuestas en el orden GB,, ..., G,, entonces la 
matriz de T en la base ordenada @ será 


Ar 0 ... 0 
(7-19) A E a 
o 0 A, 


donde A; es la k; x k; matriz asociada de p;. De una matriz n x n, A, que es 
la suma directa (7-19) de matrices asociadas de polinomios mónicos no esca- 
lares py, ..., p,, tales que p;+, divide a p; para i = 1, ..., r — 1, se dice que 
está en forma racional. El teorema de descomposición cíclica dice lo siguiente 
respecto a las matrices. 


Teorema 5. Sea F un cuergo y sea B una matriz n x n sobre F. Entonces 
B es semejante sobre el cuerpo F a una, y solo a una, matriz que está en forma 
racional. å 


Demostración. Sea T el operador lineal sobre F” representado por B en 
la base ordenada canónica. Como acabamos de observar, existe una base or- 
denada de F” en que T está representado por una matriz A en forma racional. 
Entonces B es semejante a esta matriz A. Supóngase que B es semejante sobre Fa 
otra matriz C que está en la forma racional. Esto quiere decir simplemente 
que existe una cierta base ordenada de F” en la que el operador T está repre- 
sentado por la matriz C. Si C es la suma directa de matrices asociadas C, de 


= a A AAA ——= AAA 
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polinomios mónicos £,, .... g, tal que gı divide a g; para ¿= h... s — l, 
entonces es evidente que se tienen vectores fy, ..., Bx» no nulos, en Y con T- 
amuladores g,. .... g, tales que 


V = Z6; T)® --- OZ; T). 


Pero por la unicidad del teorema de descomposición cíclica, los polinomios 
gi son idénticos a los polinomios p; que definen la matriz A. Así, C= A. I 


Los polinomios p,, . - . , p, son llamados los factores invariantes de la matriz 
B. En la Sección 7.4 se describirá un algoritmo para calcular los factores inva- 
riantes de una matriz dada B. El que sea posible calcular estos polinomios por 
medio de un número finito de operaciones racionales en los elementos de B, 
es la razón por la cual la forma racional recibe ese nombre. 


Ejemplo 2. Supóngase que V es un espacio vectorial bidimensional sobre 
el cuerpo F, y T sea un operador lineal sobre V. Las posibilidades de descom- 
posición cíclica en subespacios para T son muy limitadas. En efecto, si el poli- 
nomio minimal de T es de grado 2, es igual al polinomio característico de T. 
y T tiene un vector cíclico. Así que existe cierta base ordenada de Y en la que 
T está representado por la matriz asociada de su polinomio característico. Si, 
por otro lado, el polinomio minimal de T es de grado 1, T es un múltiplo escalar 
del operador identidad. Si T = cf, entonces para dos vectores linealmente 
independientes cualesquiera, a, y Az. en V, se tiene 


V = Zla; T) O Z(@; T) 
PDA i 


Para matrices, este análisis dice que toda matriz 2 x 2 sobre el cuerpo F es 
semejante sobre F exactamente a una matriz de los tipos 


pieh [y 3) 


Ejemplo 3. Sea T el operador lineal sobre R? representado por la matriz 


5-6 —6 
A=|-1 4 2 
3 —6 -4 


en la base ordenada canónica. Se ha calculado antes que el polinomio carac- 
terístico de T es f = (x — 1Mx — 2), y que el polinomio minimal de T es 
P = (x — Mx — 2). Así se sabe que en la descomposición cíclica de T el primer 
vector %, tendrá a p como T-anulador. Como se ha operado en un espacio 
tridimensional. puede haber solo otro vector. %z, el cual debe generar un sub- 
espacio cíclico de dimensión 1, es decir. debe ser un vector propio de T. Su T- 
anulador p, debe ser (x — 2), ya que debemos tener que pp, = f. Obsérvese 
que esto dice inmediatamente que la matriz A es semejante a la matriz 


0 =2 0 
B=|1 30 
0 0 2 


-— bhdi a aa - ai ~ 


Las formas racional y de Jordin 239 


esto es, que T está representado por B en alguna base ordenada. ¿Cómo se 
pueden encontrar los vectores adecuados a, y 07? Bien, sabemos que A 
vector que genera un subespacio T-cíclico de dimensión 2 es un vector adc- 
cuado x,. De modo que sea e,. Tenemos 


Ta = (5, —1, 3) 


que no es un múltiplo escalar de €,; luego Z(e,; T) tiene dimensión 2. Este 
espacio consta de todos los vectores ae, + b(Te,): 


a(1, 0, 0) + d(5, —1, 3) = (a + 5b, —b, 3b) 


o todos los vectores (xı, X2, X3) que satisfacen x, = 3x2. Ahora lo que se 
desea es un vector a, tal que Ta, = 20, y Zlaz; T) es disjunto de Z(a1; T). 
Como o, es un vector característico para T, el espacio Za); T) será simplemente 
el espacio unidimensional generado por «z, y así, lo que se requiere es que dz 
no esté en Z(a,; T). Si æ = (x,, X2, X3), se puede fácilmente calcular que 
Ta = 2a si, y solo si, x, = 2x2 + 2x3. Así, a, = (2, 1, 0) satisface Ta, F 2 
y genera un subespacio T-cíclico disjunto de Z(a,; T). El lector podrá verificar 
directamente que la matriz de T en la base ordenada 


111, 0, 0), (5, —1, 3); (2, 1, 0) 
es la matriz B anteriormente mencionada. 


Ejemplo 4. Supóngase que T es un operador lineal diagonalizable so- 
bre V. Es interesante relacionar una descomposición cíclica de T con una base 
que diagonaliza la matriz de T. Sean c,, ..., Cx los valores propios ein 
de T, y sea V, el espacio de los vectores propios asociados con el valor carac- 
terístico c;. Entonces 


V=V0---OV 


y si d; = dim V,, entonces 
CI (£ — a)h 


es el polinomio característico de T. Si œ es un vector de V, es fácil relacionar 
el subespacio cíclico Z(a; 7T) con los subespacios V,, ..., Vp- Existen vectores 
Bi, ---. Pi únicos, tales que f, está en V,, y 

a= fit +: + Bro 


Como Tf, = c¡f;. se tiene 


(7-20) FKT)a = fícdBr + --+ + fc) 

para todo polinomio f. Dados escalares arbitrarios f}, ..., Le existe un poli- 
nomio f tal que f(c;) = t 1 < i < k. Por tanto. Z(a; T) es justamente rl 
espacio generado por los vectores fı, ..., Pk- ¿Cuál es el anulador de a? De 


acuerdo con (7-20) se tiene f(T)a = 0 si, y solo si, ftc): = 0 para cada í. En 
otras palabras, /(T)u = 0 siempre que f(c;) = 0 para cada i tal que f; + 0. 
En consecuencia, el anulador de a es el producto 


AA TÉ IÉÚá[/]=>E>u... ls pe — 
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(7-21) I (=c). 
B70 
Ahora, sean B,= Ifi... Bas una base ordenada de V. Sea 
r = max di. 
i 
Se definen los vectores %,, ..., A, por 
(7-22) aj= Y Éj, VA 
di>j 


El subespacio cíclico Zla; T) es el subespacio generado por los vectores Bi 
cuando ¿ describe los índices para los cuales d; > j. El T-anulador de a, es > 
dj 


(7-23) Pi = M (ci). 


di>j 
Se tiene 
V = Zla; T)® --- O Z(a,; T) 
pues cada f} pertenece a uno, y solo a uno, de los subespacios Z(a,; T), ..., 


Z(9,: T), y B=(G,, ..., GB) es una base ordenada de V. Por (7-23), p, 
divide a p;. A 


Ejercicios 


Sci el s ineal s 2 s 
l. Sca T el operador lineal sobre F representado en la base ordenada canónica por la 


matriz 
o 07 
10 


Sea 1 = (0, 1). Demostrar que F? + Z(a,; T) y que existe un vector 2%, no nulo, en F? 
con Z(a,; T) disjunto de Z(a,; T). 


2. Sca T un operador lineal sobre el espacio V de dimensión finita y sea R la imagen 
por T. 

(a) Demostrar que R tiene un subespacio T-invariante complementario si, y solo si, 
R es independiente del espacio nulo N de T. 

(b) Si R y N son independientes, demostrar que N es el subespacio único T-invariante 
complementario de R. 


3. Sea T el operador lineal sobre R3 representado en la base ordenada canónica por la 


matriz 
200 
1 2 0f} 
0 0 3 


Sea W el espacio nulo de T — 2/. Demostrar que W no tiene subespacio T-invariante com- 
plementario. (Sugerencia: Sea B = €, y Obsérvese que (T — 21)f está en W. Demostrar 
que no existe « en W con (T — 21B = (T — 2M)a.) 


4. Sea T el operador lineal sobre F* representado en la base ordenada canónica por la 
matriz 


omae 
ooo 
e: ods 


c 
1 
0 
0 


Sea W el espacio nulo de F — cl. 
(a) Demostrar que W es el subespacio generado por €4. 
(b) Hallar el generador mónico de los ideales S(&4; W), S(æz; W), S(&2; W) y Sla; W). 


5. Sea T un operador lineal sobre el espacio vectorial sobre el cuerpo F. Si f es un poli- 
nomio sobre F y a está en V, sea fa = f(T). Si V,, ..., V, son subespacios invariantes 
bajo T y V = V, @ `- O Ve demostrar que 


IV =V D: DSV 
6. Sean T, V y F como en el Ejercicio 5. Supóngase que a y $ son vectores en V que tienen 


el mismo 7-anulador. Demostrar que, para cualquier polinomio f, los vectores fa y fp 
tienen el mismo 7-anulador. 


7. Hallar los polinomios minimales y las formas racionales de cada una de las siguientes 


0 -1 -1 c 0-1 pb l 
Kari voa dr poe? 1) Es ol 


1 0 0. å 


matrices reales 


8. Sea T el operador lineal sobre R? representado en la base ordenada canónica por 


E A 
i ga Bil 
2 -4 —- 


Hallar los vectores no nulos &;, ..., a, que satisfacen las condiciones del Teorema 3. 


1 3 3 
A= 3 1 3 
asce 


Hallar una matriz real O, inversible, tal que P7*AP esté en la forma racional 


9. Sea A la matriz real 


10. Sca F un subcuerpo de los números complejos y sea T el operador lineal sobre F* 
representado en la base ordenada canónica por la matriz 


2 0 
12 
0 a 
00 


0 0 
0 0lL 
2 0 
b 2 


Hallar el polinomio característico de T. Considerar los casos a = b = 1, a = b = 0. a = 0, 
b = 1. En cada uno de los casos, hallar el polinomio minimal de T y los vectores 4,,...., ap, 
no nulos que satisfacen las condiciones del Teorema 3. 


11. Demostrar que si A y B son matrices 3 x 3 sobre el cuerpo F, una condición nece- 
saria y suficiente para que A y B sean semejantes sobre F es que tengan el mismo polinomio 
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característico y el mismo polinomio minimal. Dar un ejemplo que muestre que esto us labo 
para matrices 4 x 3, 


rn. 
sobre F. Demostrar que si 4 y B son semejantes sobre el cuerpo de los numeros complejos. 
son semejantes sobre F, (Sugerencia: Demostrar que la forma racional de Pes la misma 
si se considera 4 como matriz sobre F o como matriz sobre C: do mismo para B). 


sa Fun subeuerpo del cuerpo de los numeros complejos y sean Ey B matrices 1 + s 


13. Sea A una matriz n x n de elementos complejos. Demostrar que si todo valor propio 
de A es real, A es semejante a una matriz de elementos reales. 


14. Sea 7 un operador lincal sobre el espacio 1 de dimensión finita. Demostrar que existe 
un vector x en V con esta propiedad: Si f es un polinomio y /(7')x = U. entonces AT) = 0 
(Tal vector x se llama un vector separador para el álgebra de los polinomios en 7.) Cuando 
T tiene un vector ciclico, dar una demostración directa de que cualquier vector cíclico es 
un vector separador para el álgebra de los polinomios en 7 


15, Sea F un subcuerpo del cuerpo de los números complejos y wea 4 una matriz n x n 
sobre F. Sea p el polinomio minimal para A. Si se considera a 4 como matriz sobre C. enton- 
ves A tiene un polinomio minimal / como matriz n x n sobre C. Usar un teorema sobre 
ecuaciones lineales para demostrar que p = f. ¿Se puede ver también cómo se deduce 
esto del teorema de descomposición ciclica? 


16. Sea 4 una matriz n x n con elementos reales tal que 47 + / = 0 Demostrar que 
n es par y. sin = 2k. entonces A es semejante sobre el cuerpo de los números reales a una 


matriz de forma bloque 
AN :] 


17. Sea 7 un operador lincal sobre un espacio vectorial $" de dimension linita. Supónga- 
se que 

ta) el polinomio minimal de T es una potencia de un polinomio irreducible: 

(b) el polinomio minimal es igual al polinomio característico. 

Demostrar que ningún subespacio no trivial nvariante por T tiene un subespacio com- 
plementario invariante por T. 


donde / es la matriz unidad k x k. 


18. SiT es un operador lincal diagonalizable. entonces cada subespacio invarrmte por / 
tiene un subespacio complementario invariante por 7. 


19. Sea T un operador lineal sobre el espacio I de dimensión finita. Demostrar que / 
tiene un vector ciclico si. y solo si. es cierto lo siguiente: cada operador Imeal E que conmu 
ta con T es un polinomio en T. 


20. Sea 1 un espacio vectorial de dimensión finta sobre el cuerpo E y sea } un operado: 
lincat en F. Se pregunta cuándo se verifica que cada vector no nulo de T os un vector c 
clico para 7. Demostrar que este es el caso si. y solo si, el polmomio característico para 
T es irreducible sobre F. 


21. Sea A una matriz n x n con elementos reales. Sea T el operador hneal sobre R” re 
presentado por 4 en la base ordenada canónica y sea © ol operador Imeal sobre C” repre 
sentado por 4 en la base ordenada canónica. Usar el resultado del kjer 
mostrar lo siguiente: si los únicos subespacios variantes por Z son R"A eb subespacio 
cero. entonces U es diagonalizable 


cio 20 para de- 


7.3. La forma de Jordan 


Supóngase que N es un operador lineal nilpotente en el espacio V de di- 
mensión finita. Se considera la descomposición cíclica para N que se obtiene 
del Teorema 3. Se tiene un entero positivo r y r vectores no negativos %y,.. . . , &, en 
V con N-anuladores p;,, ..., p,, tales que 


V = Zœ; N) ®© :-: O Zla; N) 


Y Pisa divide a p; para i = 1, ...,r — 1. Como N es nilpotente, el polinomio 
minimal es x* para algún k < n. Así, todo p; es de la forma p; = x* y la condición 
de divisibilidad simplemente dice que 


hi > ka > +": 2 ko 


Por supuesto, k, = k y k, > 1. La matriz asociada de x“ es la matriz k; x ki. 


0- 00 
0 --- 0.0 
(7-24) ¡yl 
da 1150 


Asi. el Teorema 3 da una base ordenada para V, en la cual la matriz de N es 
suma directa de matrices elementales nilpotentes (7-24), cuyas dimensiones 
decrecen cuando ¡ crece. Por lo que se ve que, asociados con una matriz nilpo- 
tente » x n, hay un entero positivo r y r enteros positivos k,, .. ., k,, de modo 
que kı +:::+k,=n y k; > kisi, y estos enteros positivos determinan la 
forma racional de la matriz, es decir, determinan la matriz, salvo semejanza. 
He aquí un punto que deseamos destacar respecto al operador nilpotente. 
El entero positivo r es justamente la nulidad de N; en efecto, el espacio nulo 
tiene como base los r vectores 
(7-25) Nti1a,;. 
Si x está en el espacio nulo de N, se puede escribir « en la forma 


a = fa + -+ + frar 


donde /; es un polinomio, cuyo grado se puede suponer menor que k;. Como 
Na = 0, para todo į tenemos 


0 = N(fias) 
= Nf:(N)o; 
= (afi)aæi 
xf; es divisible por x*, y como grd (f;) - k;. ello quiere decir que 
Jir 
donde «; es cierto escalar. Pero entonces 
a = alla) + --- + elrt=la,) 


Asi 


que muestra que los vectores (7-25) forman una base para el espacio nulo de N. 
El lector puede observar que este hecho es también claro desde el punto de 
vista matricial. 

Lo que se desea hacer ahora es combinar lo establecido para operadores 
o matrices nilpotentes con el teorema de descomposición prima del Capítulo 6. 
La situación es la siguiente: supóngase que T es un operador lineal sobre Y y 
que el polinomio característico de T se puede factorizar sobre F como sigue 


== cy4--- (4 01) 
donde los c}, ..., €, son elementos distintos de F y d; > 1. Entonces el poli- 
nomio minimal de T será 

p= (1 aj) --- (1 — c.)” 


donde 1 < r; < d,. Si W, es el espacio nulo de (T — c,f)*, entonces el teorema 
de descomposición prima dice que 


V=W0---OWv, 


y que el operador T; inducido en W; por T tiene polinomio minimal (x — c;)*. 
Sea N; el operador lineal en W, definido por N; = T; — cI. Entonces N; es nil- 
potente y tiene un polinomio minimal x". En W;, T actúa como N; más el es- 
calar c; veces el operador identidad. Supóngase que elegimos una base del sub- 
espacio W, que corresponda a la descomposición cíclica del operador nilpo- 
tente N;. Entonces la matriz de 7; en esa base ordenada será la suma directa 
de matrices 


e nasa) 070 

O UA 

(7-26) dv E SpA 
c 

00 -+- 1 c 


cada cual con ¢ = c; Además, las dimensiones de estas matrices decrecerán 
al ir de izquierda a derecha. Una matriz de la forma (7-26) se llama una matriz 
elemental de Jordan con valor propio c. Ahora, si se consideran en conjunto 
todas las bases para W,, se obtiene una base ordenada de V. Se describirá la 
matriz A de T en esta base ordenada. 

La matriz A es la suma directa 


As 00 À 
(1-27) a [2- Ayr.? 
o 0 -.- Az 
de matrices A,, ..., Ax. Toda A, es de la forma 
JP? 0 -- 0 
A 
dy 30% JE 


donde cada J} es la matriz elementa? de Jordan con valor propio c,. También 
en cada A; la dimensión de las matrices J} decrece cuando j crece. Se dirá que 
una matriz n x n, A, que satisface todas las condiciones descritas hasta ahora 
(para escalares distintos c}, ..., Cp) está en forma de Jordan. 

Hemos observado que si T es un operador lineal cuyo polinomio caracte- 
rístico se puede factorizar completamente sobre el cuerpo escalar, entonces 
existe una base ordenada de V, en la cual T está en forma de Jordan. Deseamos 
mostrar ahora que esta matriz es algo unívocamente asociado con T, salvo 
el orden en que se escriben los valores propios de 7. Es decir, si dos matrices 
están en forma de Jordan y son semejantes, entonces difieren solo en la orde- 
nación de los escalares c,. 

La unicidad se ve como sigue. Supóngase que existe una base ordenada ` 
de Y en la cual T está representado por la matriz de Jordan A, descrita ante- 
riormente. Si A, es una matriz d; x d;, entonces d; es claramente la multiplicidad 
de c; como raíz de polinomio característico de A o de T. En otras palabras, 
el polinomio característico de T es 


f = (x= — a)t --- (a — cA. 


Esto demuestra que Cy, ..., Ck Y di, . . -, d, son únicos, salvo el orden en que 
se escriben. El que A sea la suma directa de las matrices A,, nos da una descom- 
posición en suma directa V = W, O -:- O W, invariante por T. Obsérvese 
ahora que W; debe ser el espacio nulo de (T — c;1)", donde n = dim V; en efec- 
to, A, — c; es evidentemente nilpotente y A, — cI es no singular para j + i. 
Así vemos que los subespacios W; son únicos. Si T, es el operador inducido 
en W; por T, entonces la matriz A, está univocamente determinada como la 
forma racional de (7, — c,f). 

Queremos ahora hacer algunas observaciones más respecto al operador T y 
la matriz de Jordan A que representa a T en una base ordenada. Ellas son: 


(1) Cada elemento de A, que no esté en la diagonal principal o inmediata- 
mente debajo de ésta es O. En la diagonal de A están los k valores propios dis- 
tintos €,, ..., €, de T. También c; está repetido d; veces, donde d; es la multi- 
plicidad de c; como raíz del polinomio característico, es decir, d; = dim W,. 

(2) Para todo i, la matriz A, es la suma directa de n; matrices elementales 
de Jordan J con valor propio c,. El número n, es precisamente la dimensión 
del espacio de vectores propios asociados al valor propio c,. En efecto, n; es 
el número de bloques elementales nilpotentes en la forma racional de (T, — c,L), 
y es así igual a la dimensión del espacio nulo de (T — c¿1). En particular, ob- 
sérvese que T es diagonalizable si, y solo si, n; = d; para todo i. 

(3) Para todo i el primer bloque JẸ en la matriz A, es una matriz r; X Fi 
donde ~; es la multiplicidad de c, como raíz del polino:mio minimal de T. Esto 
se desprende de que el polinomio minimal del operador nilpotente (T, — c,£) 
Cs 


Por supuesto, como de costumbre, se tienen resultados semejantes para las 
matrices. Si B es una matriz n x n sobre el cuerpo F y si el polinomio caracte- 
rístico de B se factoriza completamente sobre F, entonces B es semejante sobre 


Fa una matriz n x n, A, en la forma de Jordan, y A es única salvo el orden de 
los valores propios. Se dice que A es la forma de Jordan de B. 

Obsérvese también que si F es un cuerpo algebraicamente cerrado, enton- 
ces las acotaciones anteriores son válidas para todo operador lincal sobre un 
espacio vectorial de dimensión finita sobre F, o para toda matriz n x n sobre F. 
Asi, por ejemplo, toda matriz n x n sobre el cuerpo de los números complejos 
es semejante a una matriz, esencialmente única. en forma de Jordan. 


Ejemplo 5. Supóngase que T es un operador lineal sobre C?. El polinomio 
característico para T es (x — c¡Mx — c2), si los números complejos C,, cz son 
distintos, o (x — c,)?. En el primer caso T es diagonalizable y está representado 
en una base ordenada por 

a 0 
[s s} 


En el segundo caso el polinomio minimal de T puede ser (x — c), y entonces 
T = cl, o puede ser (x — c)?, en cuyo caso T está representado en una base 
ordenada por la matriz 

Bmg 

lc 


Así toda matriz 2 x 2 sobre el cuerpo de los complejos es semejante a una mu- 
triz de alguno de los dos tipos anteriores, posiblemente con c, = ¢2. 


Ejemplo 6. Sea A una matriz compleja 3 x 3: 


2 um 
A=la 2 0f 
b c —1 


i i pè 2 de et 
El polinomio característico de 4 es evidentemente (x — 2P(x + 1). O este es 
el polinomio minimal, en cuyo caso Á es semejante a 


2 0 (0) 
12 0 
OUT 


o el polinomio minimal es (x — 2Mx + 1), en cuyo caso A es semejante a 


2 0 0 
0 2 0} 
Ahora 0.0 -1 
00.0 
(A-2D4+D=|3a 0 0 
ac 00 


y asi A es semejante a una matriz diagonal si, y solo si, « = 0. 


Ejemplo 7. Sea 


A= 


anoc 


(0) 
0 
oi 
2 


oo-w 
Sono 


El polinomio característico de A es (x — 2)*. Como A es suma directa de dos 
matrices 2 x 2, es claro que el polinomio minimal de A es (x — 2}. Ahora 
si a = 0 o si a = 1, entonces la matriz A está en forma de Jordan. Obsérvese 
que las dos matrices que se obtienen para a = 0 y a = 1 tienen el mismo po- 
linomio característico, pero no son semejantes. Y no lo son porque para la 
primera matriz el espacio solución de (4: — 21) tiene dimensión 3, mientras 
que para la segunda matriz tiene dimensión 2. 


Ejemplo 8 Las ecuaciones diferenciales lineales con coeficientes cons- 
tantes (Ejemplo 14, Capítulo 6) dan una bonita ilustración de la forma de Jordan. 
Sean ap. .... an-ı números complejos y sea Y el espacio de todas las funciones 
n veces derivables en un intervalo del eje real que satisfacen la ecuación dife- 
rencial 
g, 


df d 
dapi 


dan ec A 


F aai 4 


Sea D el operador derivación. Entonces V es invariante por D, ya que V es el 
espacio nulo de p(D), donde 


p=" ++: + ar H a 

¿Cuál es la forma de Jordan para el operador derivación sobre V? 
Scan c ..., € las raíces complejas distintas de p: 

p = (2 — a)” --- (£ — a)”. 
Sea V; el espacio nulo de (D — c,IJ, esto es, el conjunto de las soluciones de 
la ecuación diferencial 

(D — cI )f = 0. 

Entonces, como se observó en el Ejemplo 15, Capitulo 6, el teorema de des- 
composición prima dice que 


V=V0---OV. 


Sea N; la restricción de D — c; a V,. La forma de Jordan para el operador D 
(en V) está entonces determinada por las formas racionales de los operadores 
nilpotentes N,, ..., N, en los espacios F}, ..., Vp. 

Así, lo que se debe conocer (para los distintos valores de c) es la forma ra- 
cional del operador N = (D — cl) en el espacio Y, que consta de las solucio- 
nes de la ecuación 


(D — Iyf =0. 
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¿Cuántos bloques elementales nilpotentes habrá en la forma racional para N? 
Su número será la nulidad de N; es decir, la dimensión del espacio propio aso- 
iado al valor propio e. Esa dimensión es 1, pues cualquier función que satis- 
ace la ecuación diferencial 


Df = f 
es un múltiplo escalar de la función exponencial A(x) = e”. Por tanto, el ope- 
rador N (sobre el espacio V,) tiene un vector cíclico. Una buena elección para 
un vector cíclico es g = 7 *h: 
ga) = arde”, 
Esto da 


ll 


Ng = (r — Dar*h 
N-y=(r— 1) 


Lo visto en el párrafo anterior muestra que la forma de Jordan para D (en 
el espacio V) es suma directa de k matrices elementales de Jordan, una por cada 
raiz c. 


Ejercicios 
I. Sean M, y N, matrices 3 x 3 nilpotentes sobre el cuerpo F. Demostrar que N, y Nz 
son semejantes si, y solo si, tienen el mismo polinomio minimal. 


2. Usar cl resultado del Ejercicio 1 y la forma de Jordan para demostrar lo siguiente. Sean 
4 y B matrices n x n sobre el cuerpo F que tienen el mismo polinomio característico 


f = (2 — a)® -+ (1—c)% 


y cl mismo polinomio minimal. Si ningún d; es mayor que 3, entonces A y B son semejantes. 


3. Si A es una matriz compleja 5 x 5 con polinomio característico 
J= G- Dia +7) 


y polinomio minimal p = (x — 2)}?{x + 7), ¿cuál es la forma de Jordan para A? 
4. ¿Cuántas posibles formas de Jordan hay para una matriz compleja 6 x 6 de polino- 
mio característico (x + 2)Y(x — 1)?? 


5. El operador derivación sobre el espacio de los polinomios de grado menor o igual a 3 
está representado en la base ordenada «natural» por la matriz 


ocooo 
ocom 
oono 
ocwoso 


¿Cuál es la forma de Jordan para esta matriz? (F un subespacio de los números complejos.) 


6. Sea A la matriz compleja 


20000 0 
12000 0 
-10200 0 
01020 of 
MI A 
00001 -1 


Hallar la forma de Jordan para A. 
7. Si A cs una matriz n x n sobre el cuerpo F con polinomio característico 
f = (2 — ju -+ (2 — cJ% 
¿cuál es la traza de A? 
8. Clasificar, por semejanza, todas las matrices complejas 3 x 3, 4, tales que 43 = Z. 
9. Clasificar, por semejanza, todas las matrices complejas n x n, A, tales que 4” = I. 


10. Sea n un entero positivo, n > 2, y sea N una matriz n x n sobre el cuerpo F tal que 
N" = 0, pero N"! + 0. Demostrar que N no tiene raíz cuadrada; es decir, que no existe 
una matriz n x n, A, tal que A? = N. 


11. Sean N, y N, matrices nilpotentes 6 x 6 sobre el cuerpo F. Supóngase que N, y Nz 
tienen el mismo polinomio minimal y la misma nulidad. Demostrar que N, y N, son se- 
mejantes. Demostrar que esto no es cierto para matrices nilpotentes 7 x 7. 


12. Usar el resultado del Ejercicio 11 y de la forma de Jordan para demostrar lo siguiente. 
Sean A y B matrices n x n sobre el cuerpo F que tienen el mismo polinomio característico 


f=(1—c)4--- (1— cu 


y el mismo polinomio minimal. Supóngase que también para todo į los espacios solución 
de (A — c;I) y (B — c;[) tienen la misma dimensión. Si ningún d; es mayor que 6. entonces 
A y B son semejantes. 


13. Si N es una matriz nilpotente k x k elemental, es decir, N* = 0, pero N*1 40, 
demostrar que N' es semejante a N. Usar entonces la forma de Jordan para demostrar que 
toda matriz compleja n x n es semejante a su transpuesta. 


14. ¿Cuál es el error en la siguiente demostración? Si A es una matriz compleja n x n 
tal que 4* = — A, entonces 4 es 0. (Demostración: Sea J la forma de Jordan de A. Como 4' = 
— A, entonces J' = —J. Pero J es triangular, con lo que J' = —J implica que todo elemento 
J es cero. Como J = 0 y A es semejante a J, se desprende que A = 0.) (Dar un ejemplo 
de matriz A no nula tal que 4' = —4.) 


15. Si N es una matriz nilpotente 3 x 3 sobre C, demostrar que A = I + 4N — ¿N? 
satisface a 4? = I + N, es decir, que A es la raíz cuadrada de / + N. Usar la serie binómica 
de (1 + 1)'? para obtener una fórmula parecida para una raíz cuadrada de 7 + N. donde 
N es una matriz nilpotente n x n sobre C. 


16. Usar el resultado del Ejercicio 15 para demostrar que si c es un número complejo no 
nulo y N es una matriz compleja nilpotente, entonces (c7 + N) tiene una raíz cuadrada. 
En seguida usar la forma de Jordan para demostrar que toda matriz compleja n x n. no 
singular, tiene una raíz cuadrada. 
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7.4. Cálculo de factores invariantes 


Supóngase que A es una matriz n x n con clementos en el cuerpo F. Se 
desea encontrar un método para calcular los factores invariantes pı, ...., Pr 
que definen la forma racional para A. Se comienza con el caso sencillo en que A 
es la matriz adjunta (7.2) de un polinomio mónico 


p= ds ES ar H o 


En la Sección 7.1 se vio que p es tanto el polinomio minimal como el polinomio 
característico para la matriz adjunta A. Ahora queremos hacer un cálculo di- 
recto que muestre que p es el polinomio característico para A. En este caso 


$ 00 --- 0 Co 


-1 x 0 --- 0 a 
E ACA 

Do has 

0 0.0 -1 zoa 


Se suma x veces la fila n a la fila (z — 1), con lo que se quita x del lugar 
(n — 1, n — 1) sin cambiar el valor del determinante. Después se suma x veces 
la nueva fila n — 1 a la fila n — 2. Se continúa sucesivamente este proceso hasta 
que todas las x de la diagonal principal hayan desaparecido. El resultado es 
la matriz 


0 0.0 0 æ+- tarto 

--1 0 0 0 mt- tarta 
0 ~i 0 - O a a + Aa) 
0 0 0 0 ta 
0 00 oi —1 z + 


que tiene el mismo determinante que x7 — A. El elemento de la parte superior 
derecha de esta matriz es el polinomio p. Se puede simplificar la última columna 
sumando a ella múltiplos de las otras columnas: 


o 00 --- 0p 
1. 00 0.0 
0-10 0.0 
0 00 0.0 
0 00 =I Ô 


Se multiplica cada una de las primeras (n — 1) columnas por —1 y se efectúan 
entonces (1 — 1) intercambios de columnas adyacentes con el objeto de llevar 


A e 
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la columna » a la primera posición. El efecto total de ios 2n — 2 cambios de 
signos deja inalterado el valor del determinante. Se obtiene la matriz 


poo- 0 
010- 0 
(7-28) 001 --- 0l 


000 >. 1 
Es entonces claro que p = det (x7 — A). 

Vamos a mostrar que, para toda matriz n x n, A, hay una sucesión de ope- 
raciones de filas y columnas que transforman x7 — A en una matriz como (7-28), 
en la que los factores invariantes de A aparecen en la diagonal principal. Se 
explicarán completamente las operaciones que se deben utilizar. 

Se operará en F[x]”*", colección de las matrices n x n con elementos que 
son polinomios sobre el cuerpo F. Si M es una de tales matrices, una operación 
elemental de fila sobre M es alguna de las siguientes: 


1. Multiplicación de una fila de M por un escalar no nulo de F. 

2. Remplazo de la r-ésima fila por la suma de la fila r más f veces la fila s, 
donde f es cualquier polinomio sobre F y r Æ s. 

3. Intercambio de dos filas de M. 


La operación inversa de una operación elemental de fila es una operación 
elemental de fila del mismo tipo. Obsérvese que no se puede hacer una afirma- 
ción tal si en (1) se permiten polinomios no escalares. Una matriz elemental 
m x m. esto es, una matriz elemental de F[x]”*"” es aquella que se puede ob- 
tener de la matriz unidad m x m por medio de una operación elemental de 
fila simple. Es evidente que cada operación elemental de fila sobre M puede 
efectuarse multiplicando M a la izquierda por una matriz elemental m x m 
apropiada; en efecto, si e es la operación, entonces 


e(M) = ADM. 


Sean M, N matrices de F[x]"*". Se dice que N es equivalente por filas a M si 
N puede obtenerse a partir de M por una sucesión finita de operaciones elemen- 
tales de fila: 


M = MM-M, =N. 


Evidentemente, N es equivalente por filas a M si, y solo si, M es equivalente 
por filas a N, razón por la cual se usará la terminologia «M y N son equivalentes 
por filas». Si N es equivalente por filas a M, entonces 


N = PM 
donde la matriz m x m, P, es un producto de matrices elementales: 
P = Er Ex. 
En particular, P es una matriz inversible, con inversa 
P% = Er' -+ Er. 
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Claro que la inversa de E, proviene de la operación elemental de fila inversa. 

Todo esto es precisamente como en el caso de las matrices con elementos 
en F. Se obtienen resultados elementales paralelos a los del Capítulo 1. Por 
lanto, el siguiente problema que se plantea es introducir una forma escalón 
reducida por filas para matrices polinomiales, Aquí se presenta un nuevo obs- 
táculo. ¿Cómo se reduce por filas una matriz? La primera etapa es aislar el 
primer elemento de la fila 1 y dividir cada elemento de la fila 1 por ese elemento. 
Ello no se puede hacer (necesariamente) cuando la matriz tiene elementos poli- 
nomios. Como se verá en el siguiente teorema, se Puede soslayar esta dificultad 
en algunos casos; sin embargo, no existe una forma reducida por filas comple- 
tamente apropiada para la matriz general de F[x]"*". Si se introducen también 
operaciones de columna y se estudia el tipo de equivalencia que resulta de permi- 
tir el uso de ambos tipos de operaciones, se puede obtener una forma canónica 
muy útil para toda matriz. El instrumento básico es el siguiente. 


Lema. Sea M una matriz de Fl [xJ"*" que tiene algunos elementos no nulos 
en su primera columna, y sea p el máximo común divisor de los elementos de la 
columna | de M. Entonces M es equivalente por filas a la matriz N que tiene 


Pp 
0 


0, 
como primera columna. 


Demostración. Demostraremos algo más de lo que se ha enunciado. Mos- 
traremos que existe un algoritmo para encontrar N, es decir, una receta que 
una máquina calculadora podría utilizar para calcular N en un número finito 
de etapas. Ante todo, se necesita cierta notación. 

Sea M una matriz m x n con elementos en F[x] que tiene una primera 
columna no nula 


Se define 


(7-29) I(M,) = min grd f; 
FO 


PM) = Med. (fis ..., fa). 


Sea j un índice tal que grd f; = ((M,). Para precisar, sea j el menor índice 
i para el que grd f; = (M,). Para dividir cada fi por f; se hace 


(7-30) fi = figi +" rn=0 o grdr;< grd fi 


Para cada ¡ diferente de j, se remplaza la fila i de M por la fila ¿ menos gi; veces 
la fila f. Se multiplica la fila j por el inverso del coeficiente dominante de Sy 


Lux formas ractonal y de Jordan 253 


nees se intercambian las filas j y 1. El resultado de estas operaciones es una 
mz M’ que tiene como primera columna 


(7-31) Mi = 


i i óni S i alización de f, para 
londe f; es el polinomio mónico que se obtiene por norma raci Ji para 
e tenga coeficiente dominante 1. Hemos dado un procedimiento bien de 
finido para asociar a cada matriz M una matriz M' con las siguientes propie- 
dades: 

(a) M’ es equivalente por filas a M. 

(b) p(M;) = p(M,). 

(c) O, (Mi) < UM,) o 

p(Mı) 
mi =| 2 

0 

Es fácil comprobar (b) y (c) de (7-30) y (7-31). La propiedad (c) es a 
mente otro modo de establecer que, o existe un ¡ tal que r; +0y grd F; < gn Íi 
o bien r; = 0 para todo i y Í; es (por tanto) el máximo común divisor de 

fa Jn i ii a p atri 
3 La demostración del lema es ahora muy simple. Se comienza con la matriz 
M aplicándole el procedimiento anterior para obtener M’. La propiedad (c) 
Mice que M' servirá como la matriz N en el lema, o, (M;) < UM, ). En el último 
caso se aplica el procedimiento a M' para obtener Ja ¡Matriz M da u y. 
Si M9 no es el N conveniente, se forma M®! = (MO) y así sucesivamente. 
El caso es que las desigualdades estrictas 
UM) > UM] > UMP) > --- 


no pueden seguir mucho. Después de no más que /(M,) iteraciones de este pro- 
cedimiento, se debe llegar a una matriz MW que tiene las propiedades que se 


buscan. f 


Teorema 6. Sea P una matriz m x m con elementos en el álgebra de poli- 
nomios F[x]. Las siguientes afirmaciones son equivalentes: 


(1) P es inversible. T 
tii) El determinante de P es un polinomio escalar no nulo. 


(1) P es equivalente por filas a la matriz unidad m x m. 
(iv) P es un producto de matrices elementales. 


Demostración. Ciertamente (i) implica (ii), ya que la función determi- 
nante es multiplicativa y los únicos polinomios inversibles de F[x] son los pe- 
linomios escalares no nulos. En realidad. en el Capítulo 5 se usó el adjunto 
para hacer ver que (i) y (ii) son equivalentes. Este razonamiento da una de- 
mostración diferente de que (i) se desprende de (ii). Se completará el ciclo 


®© > (ii) 

q Ey 

(iv) € (iii). 

La única implicación que no es obvia es que (iii) se desprende de (ii). 
Supóngase (ii) y considérese la primera columna de P. Ella contiene cier- 

tos polinomios pi, ..., Pm, Y 


M.c.d. (Pu, ..., Pm) = 1 


ya que cada común divisor de p,, . . . , Pm debe dividir (al escalar) det P. Apli- 
cando el lema anterior a P se tiene la matriz 


Fl a --- am 

(7-32) o=|? 

0 

que es equivalente por filas a P. Una operación elemental de fila altera el de- 

terminante de una matriz por (a lo más) un factor escalar no nulo. Así, det Q 

es un polinomio escalar no nulo. Evidentemente, la matriz (m — 1) x (m—1)B, 

en (7-32) tiene el mismo determinante que Q. Por tanto, se aplica el lema ante- 

rior a B. Si se continúa de esta manera por m etapas, se obtiene la matriz trian- 
gular superior 


B 


l as o am] 
FA 0 1 0 da 
0.0 «1 


que es equivalente por filas a R. Obviamente, R es equivalente por filas a la 
matriz unidad m x m. |] 


Corolario. Sean M y N matrices m x n con elementos en el álgebra de po- 
linomios F[x]. Entonces N es equivalente por filas a M si, y solo si, 
N= PM 
donde P es una matriz inversible m x m con elementos en F bx]. 
Definimos ahora operaciones elementales de columna y equivalencia por 


columnas de un modo análogo a las operaciones de fila y equivalencia por filas. 
No se necesitan nuevos tipos de matrices elementales, ya que la clase de matri- 


ves que se puede obtener al hacer una operación elemental por columna en la 
matriz unidad es la misma que la clase obtenida al usar una sola Operación 
elemental por fila. 


Definición. La matriz N es equivalente a la matriz M si se puede pasar de 
Mu N por medio de una sucesión de operaciones 


M = Mm >M, >: ->M =N 


vada una de las cuales es una operación elemental de fila o una operación elemental 
de columna. 


Teorema 7. Sean M y N matrices m x n con elementos en el álgebra de 
polinomios F[x]. Entonces N es equivalente a M si, y solo si, 


N = PMQ 


mxm 


donde P es una matriz inversible de F[x] y Q es una matriz inversible de 


Pix". 


Icorema 8. Sea A una matriz n x n con elementos en el cuerpo F y sean 
Pr... P, los factores invariantes de A. La matriz xI — A es equivalente a la 
matriz diagonal n x n cuyos elementos en la diagonal son py, ...,Pys 1,1, ..., Lo 


Demostración. Existe una matriz inversible n x n, P, con elementos en 
F tal que PAP"! está en la forma racional, esto es, tiene la forma bloque 


A 0 ... 0 
Par ES 
|; 0 a 


donde 4; es la matriz asociada al polinomio p;. De acuerdo con el Teorema 7, 
la matriz 


(7-33) P(aT — A)P™ = zI — PAP-* 
vs equivalente a x7 — A. Ahora 
zI — Ar 0 ... 0 
E 
0 0 +-- zl —A, 
donde los varios 7 representan las distintas matrices unidad de dimensión apro- 


piada. Al comienzo de esta sección se discutió que x — A, es equivalente a 
la matriz 


p: 0 0 
o 1 0 
0.0 1 
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De (7-33) y (7-34) es claro que x/ — A es equivalente a una matriz diagonal 
que tiene los polinomios p; y (n — r) unos en la diagonal principal. Por una 
sucesión de intercambios de filas y columnas se pueden ordenar los elementos 
de aquella diagonal en el orden que se desee; por ejemplo, py... ppt. 1. E 


El Teorema 8 no da un medio eficaz para calcular los divisores elementales 
Pr -+ -> Pr, ya que la demostración depende del teorema de descomposición 
cíclica. Daremos ahora un algoritmo explícito para reducir una matriz de poli- 
nomios a forma diagonal. El Teorema 8 sugiere que se pueden disponer también 
esos elementos sucesivos en la diagonal principal de modo que uno divida al otro. 


Definición. Sea N una matriz de F[x]"*". Se dice que N está en la forma 
normal (de Smith) si 


(a) todo elemento fuera de la diagonal principal de N es 0; 
(b) en la diagonal principal de N aparecen (en orden) los polinomios f,, ..., f 
de modo tal que f, divide a fis, 1S<Sk<l-=1. 


En la definición el número / es / = min (m, n). Los elementos de la diagonal 
principal son f = Nu, k=1,...,L 


Teorema 9. Sea M una matriz m x n con elementos en el álgebra de po- 
linomios F[x]. Entonces M es equivalente a una matriz N que está en la forma 
normal. 


Demostración. Si M = 0, no hay nada que demostrar. Si M + 0 se dará 
un algoritmo para encontrar una matriz M' que sea equivalente a M y que tiene 
la forma 

ADO y 


(7-35) m=]|0 


donde R es una matriz (m — 1) x (n — 1) y fı divide cada elemento de R. 
Con ello se habrá terminado la demostración, ya que se puede aplicar el mismo 
procedimiento a R para obtener f), etc. 

Sea (M) el mínimo de los grados de los elementos no nulos de M. Hállese 
la primera columna que contenga un elemento de grado (M) e intercambiar 
esa columna con la columna 1. Se llamará a la matriz resultante M'%. Descri- 
bimos un procedimiento para hallar una matriz de la forma 


g 0o = 0 
0 
(7-36) : S 
0 
que es equivalente a M(%. Empezamos por aplicar a la matriz MY el proce- 
dimiento del lema anterior al Teorema 6, procedimiento que se llamará PL6. 
Resulta una matriz 


m Las formas ı dan 


pa - b 
(7-37) MO = bl E g 
qe zi f 


Si los elementos a, . . . , b son todos nulos, bien. Si no, se usa el análogo de PL6 
para la primera fila, procedimiento que se llamará PL6'. El resultado es una 
matriz 


q 0 y0 
(7-38) MO = A A a x 
e 
donde q es el máximo común divisor de p, a, .... b. Para obtener M” puede 


haberse alterado o no la buena forma de la columna 1. Si se ha alterado, se 
aplica PL6 otra vez. Y esto es lo que se busca. En no más de /(M) etapas 


Ta 
mMo* Ma yo a AÀ 


se debe llegar a una matriz M“’ que tiene la forma (7-36), ya que en cada etapa 
sucesiva se tiene que (M**D) < {M*). Se designa el proceso que se acaba 
de definir por P7-36: 


mo ŽS yo, 


En (7-36), el polinomio g puede o no dividir cada elemento de S. Si no, hallar 
la primera columna que tiene un elemento que no sea divisible por g y sumar 
tal columna a la columna 1. La primera nueva columna contiene a g y un ele- 
mento gh + r donde r + 0 y grdr < grd g. Aplicando el proceso P7-36, el 
resultado será otra matriz de la forma (7-36), donde el grado del correspon- 
diente g ha decrecido. 

Ahora es obvio que en un número finito de etapas se obtendrá (7-35), es 
decir, se llegará a una matriz de la forma (7-36) donde el grado de g no puede 
reducirse más. |] 


Queremos hacer ver que la forma normal asociada a una matriz M es única. 
Se vieron dos cosas que dan la clave de cómo los polinomios f}, ..., fi en el 
Teorema 9 están determinados univocamente por M. Primera, las operaciones 
elementales de fila y de columna no cambian el valor del determinante de una 
matriz cuadrada en más que un factor escalar no nulo. Segunda, las operaciones 
elementales de fila y de columna no cambian el máximo común divisor de cada 
elemento de una matriz. 


Definición. Sea M una matriz m x n con elementos en F[x]. Si 1 <k < 
min (m, n), se define ò(M) como el máximo común divisor de los determinantes 
de todas las submatrices k x k de M. 
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f Recuérdese que una submatriz k x k de M es aquella que se obtiene su- 
primiendo m — k filas y n — k columnas de M. En otras palabras. se eligen 
ciertos k-tuples 

I= (ù... ù), 1 4<---<4<m 
A VE ES 
y se observa la matriz formada por esas filas y columnas de M. Estamos inte- 
resados en los determinantes 


Mijn +> Mii 


(7-39) Dı (M) = det] : To. 
Man + Miss 


El polinomio ô,(M) es el máximo común divisor de los poli i 
1 polinomios D, (M), 
cuando / y J describen todos los posibles k-tuples. Ea 


Teorema 10. Si M y N son matrices m x n equivalentes, con elementos 
en F[x], entonces 


(7-40) ôM) = SAN), 1 < k < min (m, n). 


Demostración. Es suficiente demostrar que una sola operación elemental 
de fila e no cambia a ô,- Como la inversa de e es también una Operación ele- 
mental de fila, basta con demostrar lo siguiente: Si un polinomio f divide a 
todo D,,¡(M), entonces f divide a D, s(e(M)) para todos los k-tuples 7 yde 

Como estamos considerando una operación de fila. sean x2,,.... Om las filas 
de M y usemos la notación 3 i 


Dy(0;,..., 05) = Dr (M). 


Dados Iy J, ¿cuál es la relación entre D; s(M) y D, (e(M))? Se consideran los 
tres tipos de operaciones e: i 4 


(2) multiplicación de la fila r por un escalar ¢ no nulo; 
(b) remplazo de la fila r por la fila r más g veces la fila s, r Æ s; 
(c) intercambio de las filas r yira s: 


Se deja aun lado por el momento el tipo (c) y se tratará de los tipos ía) y (b) 
que solo cambian la fila r. Si r no es uno de los índices ¿,, . 


Dr. s(e(M)) = Di (M). 


Si r está entre los indices A 


- + lg, entonces 


-> Í, entonces para los dos casos tenemos 


(a) Dr sle) = Dalai... , co, y 05) 
= Dilan... y E A 
= eDi (M); 
(b) Dixel M)) = Dalai.. -, 0 + gan op 0) 
= Dr s(M) + gDilais. -op deso o p a). 
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Para las operaciones del tipo (a) es claro que cualquier f que divide a D, (M) 
también divide a D; ,¡(e(M)). Para el caso de la operación del tipo (b) obsér- 
vese que 

Dilans- -op Qa- aa a) =0, — sis = i; para algún j 
Dilain- - - , Qn- - -, Qa) = DP. (M), sis + i; para todo j. 


La 7' en la última ecuación es el k-tuple (i, ..,s,..., i) ordenado en orden 
creciente. Ahora es evidente que, si f divide cada D, ,(M), entonces f divide 
a cada D, ¿(e(M)). 

Las operaciones del tipo (c) pueden tratarse más o menos por el mismo 
razonamiento dado, o usando el hecho de que tal operación puede ser efec- 
tuada por una sucesión de operaciones de los tipos (a) y (b). Ml 


Corolario. Toda matriz M de F[x]”*" es equivalente precisamente a una 


matriz N que está en forma normal. Los polinomios fı, ..., f, que aparecen 
en la diagonal principal de N son 
PL 1 <k < min (m,n) 


MY 
donde, por conveniencia, se define ó(M) = 1. 


Demostración. Si N está en forma normal con elementos en la diagonal 
fis ..-, jj es muy fácil ver que 


SN) = ff >> fu NM 


Por supuesto que la matriz N en este último corolario se llama la forma 
normal de M. Los polinomios f,, ..., f son llamados a menudo los factores 
invariantes de M. 

Supóngase que A es una matriz n x n con elementos en F, y sean p,,...,p, 
los factores invariantes de A. Se ve ahora que la forma normal de la matriz 
ví — A tiene en la diagonal los elementos 1, 1, ..., 1, p,, ..., pj. El último 
corolario dice qué son py, ..., p,, en términos de las submatrices de x/ — A. 
El número n — r es el mayor k tal que 0, (x7 — A) = 1. El polinomio minimal 
pı es el polinomio característico de A dividido por el máximo común divisor 
de los determinantes de todas las submatrices (n — 1) x (n — 1) de xI — A, etc. 


Ejercicios 


1. ¿Es verdadero o falso que toda matriz de F[x]"*" es equivalente por filas a una matriz 
triangular superior? 


2. Sea Tun operador lineal sobre un espacio vectorial de dimensión finita y sea A la matriz 
de T en una base ordenada. Entonces T tiene un vector cíclico si, y solo si, los determinantes 
de las submatrices (n — 1) x (n — 1) de x/ — A son primos relativos. 


3. Sea A una matriz n x n con elementos en el cuerpo F y sean f}, ..., fa los elementos 
de la diagonal de la forma normal de x/ — A. ¿Para qué matrices A es f, + 1? 


ds ii A O 
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4. , C onstruir un operador lineal 7 con polinomio minimal ax — Ip y polinomio carac- 
teristico ca = 1). Describir la descomposición prima del espacio vectorial por Ty hallar 
las Proyecciones sobre los componentes primos. Hallar una base en la cual la matriz de 
T esté en forma de Jordan. Hallar también una descomposición explícita en suma directa 
del espacio subespacios T-cíclicos, como en el Teorema 3 y dar los factores invariantes. 


5. Sea T el operador lineal sobre RE representado en la base canónica por la matriz 


O + =oO0=-oor»- 


O==ro0oroor 


Om = 2000 


l 


OrRr=-ooon- 


ocoroooon- 

OSrooooor- 
| 

OrrO=r-- 


00000002. 


(a) Hallar el polinomio característico y los factores invariantes. 

(b) Hallar la descomposición prima de Rë por T y las proyecciones en los componentes 
primos. Hallar la descomposición ciclica de cada Componente primo, como en el Teorema 3 

(c) Hallar la forma de Jordan de A. pe 

(d) Hallar una descomposición en suma directa de R? en subespacios T-ciclicos, como 
en el Teorema 3. (Sugerencia: Un modo de hacerlo es usar el resultado en (b) y hna apro- 
piada generalización de las ideas estudiadas en el Ejemplo 4.) 


7.5. Resumen: operadores semisimples 


A En los dos últimos capítulos nos hemos ocupado de un operador lineal 
simple T sobre un espacio vectorial V de dimensión finita. El programa ha con- 
sistido en descomponer T en suma directa de operadores lineales de naturaleza 
elemental, con el objeto de tener información detallada respecto a cómo «opera» 
T sobre el espacio V, Resumimos lo que se ha hecho hasta ahora. 

Comenzamos estudiando T por medio de los valores propios y los vectores 
propios. Introdujimos operadores diagonalizables, operadores que pueden ser 
completamente descritos en términos de los valores y vectores propios. Obser- 
vamos entonces que T podía no tener un vector propio simple. Aun en el caso 
de un cuerpo escalar algebraicamente cerrado, cuando todo operador lineal 
tiene al menos un vector propio, se observó que los vectores propios de T no 
generaban necesariamente el espacio. 

Se demostró luego el teorema de descomposición cíclica, que expresa cual- 
quier operador lineai como suma directa de operadores con un vector ciclico. 
sin hipótesis alguna acerca del cuerpo escalar. Si U es un operador lineal con 
un vector cíclico, existe una base {ø;, ..., A) con 

Ua; = ajn, j=1...,n—1 


Uan = — CO — (10 r — Cp_¡Otp. 


AAA 
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El efecto de U sobre esta base es entonces trasladar cada a al siguiente vector 
%;,1, Con excepción de que Ug, es una combinación lineal preestablecida de 
los vectores de la base. Como el operador lineal general T es suma directa de 
un número finito de tales operadores U, se obtuvo una descripción explícita 
y razonablemente elemental del efecto de T. 

A continuación se aplicó el teorema de descomposición cíclica a operadores 
nilpotentes. Para el caso de un cuerpo escalar algebraicamente cerrado, se com- 
binó esto con el teorema de descomposición prima para obtener la forma de 
Jordan. La forma de Jordan da una base (,, ..., 0,) del espacio V tal que, 
para todo j, o bien Ta; es un múltiplo escalar de a, o bien Ta; = CO + ajy- 
Tal base describe ciertamente el efecto de T de modo explícito y elemental. 

La importancia de la forma racional (o de la forma de Jordan) proviene 
de que existe, más bien que del hecho que se pueda calcular en casos determi- 
nados. Claro está que si se tiene un operador lineal específico T y se puede calcu- 
lar su forma cíclica o de Jordan, es lo que hay que hacer, pues, teniendo csa 
forma, se puede deducir una gran cantidad de información acerca de T. Dos 
tipos diferentes de dificultades surgen en el cálculo de esas formas canónicas. 
Una es desde luego lo largo de los cálculos. Otra, que puede no haber un mé- 
todo para hacer los cálculos, incluso si se tienen el tiempo y la paciencia ne- 
cesarios. La segunda dificultad surge, por ejemplo, al tratar de hallar la forma 
de Jordan de una matriz compleja. Sencillamente no hay un método bien de- 
finido para factorizar el polinomio característico, y así uno queda detenido al 
empezar. La forma racional no presenta esta dificultad. Como se vio en la Sec- 
ción 7.4, hay un método bien definido para hallar la forma racional de una 
matriz n x n dada; con todo, los cálculos son por lo general extremadamente 
largos. 

En el resumen de los resultados de estos dos últimos capítulos no se ha men- 
cionado aún uno de los teoremas que se demostraron. Es el teorema que dice 
que si T es un operador lineal sobre un espacio vectorial de dimensión finita 
sobre un cuerpo algebraicamente cerrado, T se expresa univocamente como 
suma de un operador diagonalizable y de un operador nilpotente que conmutan. 
Esto se demostró con el teorema de descomposición prima y con cierta infor- 
mación sobre los operadores diagonalizables. No es éste un teorema tan pro- 
fundo como el de la descomposición cíclica o el de la existencia de la forma 
de Jordan, pero sí tiene aplicaciones importantes y útiles en algunas partes de 
la matemática. Para concluir este capítulo demostraremos un teorema análogo 
sin suponer que el cuerpo escalar es algebraicamente cerrado. Comenzaremos 
definiendo los operadores que desempeñan el papel de los operadores diago- 
nalizables. 


Definición. Sea V un espacio vectorial de dimensión finita sobre el cuerpo 
F y sea T un operador lineal sobre V. Se dice que T es semisimple si todo subespacio 
T-invariante tiene un subespacio complementario T-invariante. 


Lo que se va a demostrar es que, con ciertas restricciones sobre el cuerpo F, 
todo operador lineal T se expresa univocamente en la forma T = S + N, don- 


—— 


» 


ii ds A E A 
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de S es semisimple, N es nilpotente y SN = NS. Primero se han de caracterizar 
los Operadores semisimples por medio de sus polinomios minimales, y esta 
caracterización hará ver que, cuando F es algebraicamente cerrado, un ope- 
rador es semisimple si, y solo si, es diagonalizable. - 


y Lema, Sea T un operador lineal sobre el espacio vectorial de dimensión 
Sinita V y sea V=W, @:-- W, la descomposición prima de T; es decir 
si p es el polinomio minimal de T y p = p} --- Pr es la factorización prima de el 

. tonces W; es el espacio nulo de PATY+. Sea W el subespacio de V que es inoa- 
riante por T. Entonces 


W=(WNW)e:-:e aw) 


Demostración. Para la demostración se necesita recordar un corolario de 


la demostración del teorema de descomposición prima, en la Sección 6.8. Si 
E,, . . . , E, son las proyecciones asociadas a la descomposición V = W, Y ---9 
W;, entonces cada E, es un polinomio en T. Esto es, existen polinomios k h 
tales que E; = h;(T). Ni a) 

Sea ahora W el subespacio que es invariante por T. Si a es un vector cual- 


quiera de W, entonces g = 4, + *-* + ap, con a, en W;. Ahora a, = Ea = 
h¡(T)a, y como W es invariante bajo T, cada 2, está también en W. Así cada 
vector a de Wesde la formaa = 0, +--- + 0. con a,en la intersección W AM W. 


Esta expresión es única, ya que V= W, 9 --- 0 W,. Poi tanto. 


W=(WWAWO--O(WNW. E 


; Lema. Sea T un operador lineal sobre V y supóngase que el polinomio mi- 
nimal de T es irreducible sobre el cuerpo escalar F. Entonces T es semisimple. 


Demostración. Sea W un subespacio de V invariante por T. Se debe de- 
mostrar que W tiene un subespacio complementario 7-invariante. De acuerdo 
con el corolario del Teorema 3, será suficiente demostrar que si f es un poli- 
nomio y $ es un vector de V tal que HT )B está en W, entonces existe un vector 
a en W con AMP = F(Tja. Así, pues, supóngase que £ está en V y que f es un 
polinomio tal que f(T)B está en W. Si HT)P = 0, se hace x = 0 y entonces x 
es un vector en W con f(T)f = f(T). Si HT)P + 0, el polinomio f no es ak 
visible por el polinomio minimal p del operador T. Como p es primo, eso quiere 
decir que ye y p son primos relativos y existen polinomios g y h tales que fe + 
ph = 1. Como p(T) = 0 se tiene entonces que f(T)e(T) = 1. De esto se si e 
que el vector ff debe estar en el subespacio W; en efecto, et 


B = g(T)f(T)B 
= ATUDE) 


cuando /(T)f está en W y W es invariante por T. Se hace x= f. f 


Teorema 11. Sea T un operador lineal sobre un espacio vectorial de di- 
mensión finita V. Una condición necesaria y suficiente para que T sea semisimple 


p 


Bve oa 


Mi a a A EA cc... ct AS -a S 
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es que el polinomio minimal p de T sea de la forma p = p, *** py, donde py, ...,Pk 


son polinomios irreducibles distintos sobre el cuerpo escalar F. 


Demostración. Supóngase que T es semisimple. Se demostrará que ningún 
polinomio irreducible está repetido en la factorización prima del polinomio 
minimal p. Supóngase lo contrario. Entonces existe algún polinomio mónico g, 
no escalar, tal que g? divide a p. Sea W el espacio nulo del operador g(7). Enton- 
ves W es invariante por T. Ahora bien, p = g?h para algún polinomio kx. Como 
g no es un polinomio escalar, el operador g(7M(T) no es el operador cero y 
hay un vector $ en V tal que g(TM(T)B + 0; es decir, (gh) + 0. Ahora. (gh)P 
está en el subespacio W, ya que g(ghß) = g?hf = pp = 0. Pero no existe vector 
alguno a en W tal que ghf = ghz; en efecto, si a está en W 


(gh)a = (hg)a = h(ga) = M0) = 0. 
Así W no puede tener un subespacio complementario T-invariante, contradi- 
ciendo la hipótesis de que 7 es semisimple. 

Ahora supóngase que la factorización prima de p es p = pı *** P, donde 
Pi» ---» Pg Son polinomios mónicos (no escalares) irreducibles distintos. Sea 
W un subespacio de V invariante por T. Se demostrará que V tiene un subes- 
pacio complementario T-invariante. Sea V = W, O ::: O W, la descompo- 
sición prima de T, es decir, sea W; el espacio nulo de p;(T7). Sea T; el operador 
lineal inducido en W; por T, de modo que el polinomio minimal de T; sea el 
primo pj. Ahora, W A W; es un subespacio de W, que es invariante por 7; (o 
por T). Por el último lema existe un subespacio V, de W; tal que W, = 
(W A W) O V; y Vjes invariante por T; (y, por tanto, por T). Entonces tenemos 


V=W0-:--QW: 
= WONWOVO-:OWNWOYV: 
= (WONWI+-"+(WNAWJOVO---OV, 


Por el primer lema anterior, W = (W N W,)0::: 0 (W N W,). De modo 
que si W"=V,0D:::Q/V,, entonces V= W@W y W' es invariante 
por T. I 


Corolario. Si T es un operador lineal sobre un espacio vectorial de dimensión 
finita sobre un cuerpo algebraicamente cerrado, T es semisimple si, y solo si, 
T es diagonalizable. 


Demostración. Si el cuerpo de los escalares es algebraicamente cerrado, 
los primos mónicos sobre F son los polinomios x — c. En este caso T es semi- 
simple si, y solo si, el polinomio minimal de T es p = (x — c1):* + (x — ck), 
donde los c}, ..., Cp son elementos distintos de F. Esto es precisamente el cri- 
terio para que T sea diagonalizable, que se estableció en el Capítulo 6. f 


Debemos señalar que T es semisimple si, y solo si existe un polinomio f, 
que es producto de factores primos distintos, tal que f(T} = 0. Esto es solo 
en apariencia diferente de la condición de que el polinomio minimal sea un 
producto de factores primos distintos. 
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Sea ahora expresar un operador lineal como suma de un operador lineal 
semisimple y de un operador nilpotente que conmutan. Para ello se restringirá 
el cuerpo de los escalares a un subcuerpo de los números complejos. El lector 
advertido verá que lo importante es que el cuerpo F sea un cuerpo de caracte- 
rística cero, esto es, que para todo entero positivo n, lasuma 1 +++ + 1 (n veces) 
en F no debe ser 0. Para un polinomio f sobre F, se representa por f® la k-ésima 
derivada formal de f. En otras palabras, f® = D*f, donde D es el operador 
derivación sobre el espacio de los polinomios. Si g es otro polinomio, f(g) re- 
presenta el resultado de sustituir g en f, es decir, el polinomio que se obtiene 
por la aplicación de f al elemento g en el álgebra lineal F[x]. 


Lema (fórmula de Taylor). Sea F un cuerpo de característica cero y sean 
g y h polinomios sobre F. Si f es cualquier polinomio sobre F con grd f < n, 
entonces 


t n 
SE) = fih) + fhg — h) + en l8=HN +: + Fh 


(g — AY. 


n! 


Demostración. Lo que estamos demostrando es una generalización de la 
fórmula de Taylor. El lector probablemente estará familiarizado con el caso 
especial en que 4 = c, un polinomio escalar, y g = x. En tal caso, la fórmula 
dice que 


S = fæ) = KA +SP — c) 
A EOG on 


La demostración de la fórmula general es nada más que una aplicación 
del teorema del binomio 


(a + B) = at + kamb q ETD oap y o, 
El lector deberá ver que, como la sustitución y derivación son procesos lineales, 
solo se necesita demostrar la fórmula cuando f= x*. La fórmula para 
n 
f= 2 cia* se deduce por combinación lineal. En el caso f=x* con 
=0 
k < n, la fórmula dice que 


g = he + kg — n) + EED peg — he E -o + g hy 


que no es más que el desarrollo binómico de 
o= [k+ -h | 


Lema. Sea F un subcuerpo de los números complejos, sea f un polinomio 
sobre F y sea f' la derivada de f. Las siguientes afirmaciones son equivalentes: 


(a) f es el producto de polinomios irreducibles distintos sobre F. 
(b) f y f' son primos relativos. 


a ds. A A 
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(c) Como polinomio de coeficientes complejos, f no tiene raices repetidas. 


Demostración. Demostremos primero que (a) y (b) son afirmaciones equi- 
valentes acerca de f. Supóngase que en la factorización prima de f sobre el 
cuerpo F, algún polinomio primo (no escalar) p esté repetido. Entonces f = p?h 
para algún ⁄% en F[x]. Entonces 


f' = pk + 2pp'h 


y p es también un divisor de f’. Luego f y f’ no son primos relativos. Conclui- 
mos que (b) implica (a). : 

Ahora supóngase que f =p, -** py, donde py, ..., Px son polinomios 
irreducibles no escalares distintos sobre F. Sea fJ; = fip; Entonces 


F = pifi + pafe + -o + pix 


Sca p un polinomio primo que divide a f y a f’. Entonces p = Pi para cierto i. 
Ahora bien, p; divide a f; para j + i, y como p, también divide a 


k 
S= 30, 
j=1 


vemos que p; debe dividir a p;f;. Por tanto, p; divide a f; o a p;. Pero p; no divide 
1 f/i ya que Pı, ...., Py Son distintos. Así p; divide a p;. Esto no es posible, ya 
que p; tiene grado menor en una unidad que el grado de p;. Concluimos que nin- 
pun primo divide a f y a f', o que (f, f) = 1. 

Para ver que la afirmación (c) es equivalente a (a) y (b), se necesita solamente 
observar lo siguiente. Supóngase que f y g son polinomios sobre F, un sub- 
cuerpo de los números complejos. Se puede considerar también a f y g como 
polinomios con coeficientes complejos. La afirmación de que f y g son primos 
relativos como polinomios sobre F, es equivalente a la afirmación de que fyg 
son primos relativos como polinomios sobre el cuerpo de los números com- 
plejos. Se deja la demostración como ejercicio. Se usa este hecho con g=f. 
Obsérvese que (c) no es más que (a) cuando f es considerado como polinomio 
sobre el cuerpo de los números complejos. Así (b) y (c) son equivalentes por 
el mismo razonamiento que se dio anteriormente. | 


Podemos ahora demostrar un teorema que hace más evidente la relación 
entre los operadores semisimples y los operadores diagonalizables. 


Teorema 12. Sea F un subcuerpo del cuerpo de los números complejos, 
sea V un espacio vectorial de dimensión finita sobre el cuerpo F y sea T un ope- 
rador lineal sobre V. Sea @ una base ordenada de V y sea A la matriz de T en la 
hase ordenada @. Entonces T es semisimple si, y solo si. la matriz A es semejante, 
sobre el cuerpo de los números complejos. a una matriz diagonal. 


Demostración. Sea p el polinomio minimal de T. Según el Teorema 11, 
F es semisimple si, y solo si, p = p, ` `` py, donde los p,,..., py son polino- 
mios irreducibles distintos sobre F. Por el último lema se ve que T es semisimple 
si, y solo si, p no tiene raíces complejas repetidas. 
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Ahora p es también el polinomio minimal de la matriz A. Se sabe que A 
es semejante, sobre el cuerpo de los números complejos, a una matriz diagonal 


si, y solo si, su polinomio minimal no tiene raíces complejas repetidas. Esto 
demuestra el teorema. J 


Teorema 13. Sea F un subcuerpo del cuerpo de los números complejos, 
sea V un espacio vectorial de dimensión finita sobre F y sea T un operador lineal 
sobre V. Existen un operador semisimple S en V y un operador nilpotente N en 
V tal que 


ü T=S+N; 
(ii) SN = NS. 


Además, el S semisimple y el N nilpotente que satisfacen (i) y (ii), son únicos y 
cada uno es un polinomio en T. 


Demostración. Sea pj + *+p"* la factorización prima del polinomio mi- 
nimal de T y sea f = p, : * * px. Sea r el mayor de los enteros positivos F4, . . ., Fk- 
Entonces el polinomio f es un producto de factores primos distintos, f” es divi- 
sible por el polinomio minimal de 7. y así 


FTy =0. 


Se construirá una sucesión de polinomios go, gı, Z2, -.- tal que 
bl E 
Iz- È of 
j=0 


es divisible por f"+', n = 0, 1, 2, . . . Se toma gy = 0 y entonces fix — go f°) = 
Ax) = f es divisible por f. Supóngase que se han elegido los go, . . - , g&n- ı- Sea 


de modo que, por suposición, f(A) es divisible por f". Se quiere elegir g, de 
modo que 


JM — gnf”) 


sea divisible por f"*!. Aplicando la fórmula general de Taylor se obtiene 
Sih — gaf") = FM) — gaf (h) + fb 


donde b es cierto polinomio. Por hipótesis, f(h) = qf". Así se ve que para ob- 
tener que f(h — g,f”) sea divisible por f”** se necesita solo elegir g, de tal 
modo que (q — g,f”) sea divisible por f. Esto puede hacerse, ya que f no tiene 
factores primos repetidos, con lo que f y f' son primos relativos. Si a y e son 
polinomios tales que af + ef” = 1 y si se hace g, = eq, entonces q — g,f” es 
divisible por f. 


Se tiene ahora una sucesión go, £; tal que f”*! divide a 


¡(2 — y as). Tomemos n = r — 1, y entonces, como f(TY = 0, 
j=0 
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O = 0. 
N =E OY =E ONTV. 


Como z gfi es divisible por f, se ve que N" = 0 y N es nilpotente. Sea 
j=1 


S= T-N, entonces f(S) = [(T — N)=0. Como f tiene factores primos 
distintos, S es semisimple. 

Ahora se tiene T = S + N, donde S es semisimple, N nilpotente y cada 
uno es un polinomio en 7. Para demostrar la unicidad, se pasará del cuerpo 
de los escalares F al cuerpo de los números complejos. Sea (3 una base orde- 
nada del espacio V. Se tiene entonces que 


[Tla = [Se + [We 


mientras que [S]g es diagonalizable sobre los números complejos y [N]g es 
milpotente. Estas matrices diagonalizables y nilpotentes que conmutan están 
univocamente determinadas, como se vio en el Capítulo 6. | 


Ejercicios 


1. Si N es un operador nilpotente sobre V, demostrar que para cualquier polinomio f, 
la parte semisimple de f(X) es un múltiplo escalar del operador identidad (F. subcuer- 
po de C). 


2. Sean F un subcuerpo de los números complejos, V un espacio vectorial de dimensión 
finita sobre F y T un operador lineal semisimple sobre V. Si f es cualquier polinomio sobre 
F. demostrar que f{7') es semisimple. 


3. Sea T un operador lineal sobre un espacio de dimensión finita sobre un subcuerpo 
de C. Demostrar que T es semisimple si, y solo si, es cierto lo siguiente: si f es un polinomio 
y KT) es nilpotente, entonces f(T) = 0. 
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8. Espacios con producto 
interno 


8.1. Productos internos 


A lo largo de este capítulo se considerarán solo espacios vectoriales reales 
o complejos, esto es, espacios vectoriales sobre el cuerpo de los números rea- 
les o el cuerpo de los números complejos. El principal objetivo ahora es el estudio 
de los espacios vectoriales en los que tiene sentido hablar de «longitud» de un 
vector y de «ángulo» entre dos vectores. Se hará esto mediante el estudio de 
cierto tipo de función de valor escalar sobre parejas de vectores, conocido como 
producto interno. Un ejemplo de producto interno es el producto escalar de 
vectores en R?, El producto escalar de los vectores 


a = (2,72%) y B= (YY Y) 


en R°? es el número real 


(alB) = 2 + tay + 239. 


Geométricamente, este producto escalar es el producto de la longitud de a 
la longitud de $ y el coseno del ángulo entre a y P. Es, por tanto, posible de- 
finir los conceptos geométricos de «longitud» y «ángulo» en R? por la defini- 
ción algebraica de un producto escalar. 

r Un producto interno sobre un espacio vectorial es una función con pro- 
piedades similares a las del producto escalar en R?, y en términos de tal producto 
interno se puede también definir «longitud» y «ángulo». El comentario respecto 
a la noción general de ángulo se restringirá al concepto de perpendicularidad 
(u ortogonalidad) de vectores. En esta primera sección se dirá qué es un pro- 
ducto interno, se considerarán unos ejemplos particulares y se establecerán 
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algunas de las propiedades básicas de los productos internos. Entonces se vol- 
verá a la tarea de discutir longitud y ortogonalidad. 


Definición. Sean F el cuerpo de los números reales, o de los complejos, y 
V un espacio vectorial sobre F. Un producto interno sobre V es una función que 
asigna a cada par ordenado de vectores a, P de V un escalar (08) de F de tal modo 
que para cualesquiera a, B, y de V y todos los escalares c 

(a) (a + blv) = (alv) + (6lm; 

(b) (cal) = c(al6); 

(c) (Bla) = (@fb), donde la barra indica conjugación compleja; 

(d) (aja) > 0 si a E 0. 

Debe observarse que las condiciones (a), (b) y (c) implican que 


ie) (aleg + y) = tlalb) + (alv). 

Otra observación debe hacerse. Si F es el cuerpo R de los números reales, los 
complejos conjugados que figuran en (c) y (e) están demás; sin embargo, en 
ël caso de los complejos son necesarias para la consistencia de las condiciones. 
Sin estos complejos conjugados se tendría la contradicción: 


(aJa)>0 y (iaia) = —1(a]a) > 0. 
En los ejemplos que siguen y a lo largo del capítulo, F es el cuerpo de los 
números reales o de los números complejos. 


Ejemplo 1. En F” existe un producto interno que se llama producto interno 
canónico. Está definido sobre a = (X1, .... Xa) Y P = (Yi, -+ Yn) por 


(8-1) (alb) = 22505 
Cuando F = R, esto también puede escribirse 
(a]8) = 205 
En el caso real, el producto interno canónico es el llamado a menudo producto 
escalar, y se representa por a > f. 
Ejemplo 2. Para « = (xı, x2) y P = (yı, y2) en R?, sea 
(018) = 21 — 22 — tiye + Araya. 


Como (aja) = (x; — x2}? + 3x3, se tiene que (uJu) > 0 si a + 0. Las con- 
diciones (a), (b) y (c) de la definición se pueden verificar fácilmente. 


Ejemplo 3. Sean V = F"*”, el espacio de todas las matrices n x n sobre F. 
Entonces V es isomorfo a F” de un modo natural; se sigue, pues, del Ejem- 
plo 1, que la igualdad 

(41B) =2 ArBar 


€ _——> AA 
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define un producto interno sobre V. Además, si se introduce la matriz trans- 
puesta conjugada B*, donde B% = B,,. se puede expresar este producto interno 
sobre F"*” en términos de la función traza: 


(4]B) = tr (4AB*) = tr (B*A). 
En efecto, 


tr (AB*) = 3 (ABS); 
j 
= X E AuBi, 
j k 
am 2 2 ABr 
j k 


Ejemplo 4. Sea F”*' el espacio de las matrices (columnas) n x 1 sobre F, 
y sea Q una matriz inversible n x n sobre F. Para X, Y en F"** se hace 


(X|Y) = Y*Q*QX. 


Se identifica la matriz 1 x 1 del segundo miembro con su solo elemento. Cuan- 
do Q es la matriz unidad, este producto interno es esencialmente el mismo del 
Ejemplo 1; se llama el producto interno canónico sobre F"**. El lector deberá 
observar que la terminología de «producto interno canónico» se usa en dos 
contextos especiales. Para un espacio vectorial general de dimensión finita 
sobre F no hay un producto interno obvio que se pueda llamar canónico. 


Ejemplo 5. Sea V el espacio vectorial de las funciones continuas de valor 
complejo en el intervalo unitario, 0 < t < 1. Sea 


AD = [11090 a. 


El lector está probablemente más familiarizado con el espacio de las funciones 
de valor real en el intervalo unitario, y para este espacio la conjugación com- 
pleja puede omitirse. 


Ejemplo 6. Este es en realidad un conjunto de ejemplos. Por el siguien- 
te método se pueden construir nuevos productos internos a partir de uno dado. 
Sean V y W espacios vectoriales sobre F y supóngase que (| ) es un producto 
interno sobre W. Si T es una transformación lineal no singular de Y en W, en- 
tonces la igualdad R 


prla, B) = (Tal TB) 
define un producto interno py sobre V. El producto interno del Ejemplo 4 es 
un caso especial de esta situación. También lo son los siguientes: 
(a) Sea V un espacio vectorial de dimensión finita y sea 
G= {an . - . , nj 


una base ordenada de V. Sean €,, ..., €, los vectores de la base canónica en 
F” y sea T la transformación lineal de V en F” tal que Ta, =€,j=1,...,5. 
En otras palabras, sea T el isomorfismo «natural» de V sobre el producto in- 
terno canónico sobre F”, entonces 


` . 
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pr(2 2,0), È yar) = È 28; 
i k j=1 


Asi. para cada base para V existe un producto interno sobre Y con la propiedad 
de que (alx) = 0; en efecto, es fácil ver que existe exactamente uno solo 
de tales productos internos. Más adelante se verá que cada producto interno 
sobre Y está determinado por alguna base @ en la forma anterior. 

(b) Volvamos nuevamente al Ejemplo 5 y tomemos V = W, el espacio 
de las funciones continuas en el intervalo unitario. Sea T el operador lineal 
«multiplicación por 1», esto es, (TAXE) = tfit), 0 < t < 1. Es fácil ver que 
T es lineal. También T es no singular; en efecto, supóngase que Tf = 0. Enton- 
ces 1f(1) = 0 para 0 < ¢ < 1; luego f(r) = 0 para t > 0. Como f es continua, 
se tiene también que /(0) = 0, o f = 0. Ahora, usando el producto interno 
del Ejemplo 5, se construye un producto interno nuevo sobre V haciendo 


prf) = f; NOTDO dt 
H Í MOMO 


Se vuelve ahora a las observaciones generales para los productos internos. 
Supóngase que V es un espacio vectorial complejo con un producto interno. 
Entonces, para todo a, p en V 


(alb) = Re (a]8) + ê Im (al) 


donde Re (a]8) e Im (x]8) son las partes real e imaginaria del número comple- 
jo (af). Si z es un número complejo, entonces Im (z) = Re (— iz). Se sigue que 


Im (alg) = Re [—:(a/6)] = Re (0118). 


Así, el producto interno está completamente determinado por su «parte real» 
de acuerdo con 


(8-2) (0/8) = Re (a]8) + ¿Re (aliB). 


Ocasionalmente es muy útil saber que un producto interno sobre un espacio 
vectorial, real o complejo, está determinado por otra función, la llamada forma 
cuadrática determinada por el producto interno. Para definirla, primero se 
representa la raíz cuadrada positiva de (a]a) por [la]; llal] es la llamada norma 
de a respecto al producto interno. Considerando el producto interno canónico 
en R!, Cl, R? y RI, el lector podrá convencerse de que es apropiado pensar 
en la norma de g como la «longitud» o «magnitud» de a. La forma cuadrática 
determinada por el producto interno es la función que asigna a cada vector x 
el escalar ||a]|?. Se sigue de las propiedades del producto interno que 


lle + fll? = lal]? + 2 Re (a18) + Ilell? 


para todos los vectores a y f. Así, en el caso real 


(6) (ala) = Ł lle + pl? — ¿lla — All 
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En el caso complejo se usa (8-2) para obtener la expresión más complicada 
> 1 Sr <a 
6 (l8) = ¿lla + pl? — ¿lle — all? + $ llo + igl]? — q llo — sell. 


Las igualdades (8-3) y (8-4) son llamadas las identidades de polarización. Obsér- 
vese que (8-4) puede también ser escrita de la siguiente manera: 


Par. 
(al) = 4,2 i” lla + igl]? 


Las propiedades obtenidas anteriormente son válidas para cualquier pro- 
ducto interno sobre un espacio real o complejo V, independientemente de su 
dimensión. Se vuelve al caso en que Y es de dimensión finita. Como es de pen- 
sarlo, un producto interno en un espacio de dimensión finita puede pas descrito 
siempre en términos de una base ordenada por medio de una matriz 

Supóngase que V es de dimensión finita, de modo que f 


&= {an -. . , n} 


es una base ordenada de V y que se tiene dado un producto interno particular 


sobre V; se verá que el producto intern á 
` o está completamente de i 
por los valores ý SMr oS 


(8-5) Gir = (orla;) 


que tienen los pares de vectores en @. Si a = Exo y P=Y y, Entonces 
k JS r 


(a]8) = a Z.04|B) 
es z Z:(ar]8) 
= È t: È Jilala) 
k j 
=2 OCA 
jk 


= Y*GX 
donde X, Y son las matrices de coordenadas de a y P en la base ordenada @, 
y G es la matriz con elementos Gr = CATAN Se llama a G la matriz del producto 
interno en la base ordenada (3. Se sigue de (8-5) que G es hermítica, es decir. 


A 3 ; 5 
que G = G*; sin embargo, G es una clase de matriz hermítica más bien especial. 
En efecto, G debe satisfacer, además, la condición 


(8-6) X'CX>0 X#0. 


En particular, G debe ser inversible. Ya que en caso contrario existe una ¥ + 0 
tal que GX = 0, y para toda tal X, (8-6) es imposible. En forma más explícita. 
(8-6) dice que para los escalares Xis + -., Xa, no todos nulos, 


(8-7) E Gat > 0. 
ER 
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Con esto se observa inmediatamente que cada elemento de la diagonal de G 
debe ser positivo; sin embargo, esta condición para los elementos de la diago- 
nal no es del todo suficiente para asegurar la validez de (8-6). Condiciones su- 
licientes para la validez de (8-6) se darán más adelante. 

El proceso anterior es reversible; esto es, si G es cualquie: matriz n x n 
sobre F que satisface (8-6) y la condición de que G = G*, entonces g es la matriz 
en la base ordenada @ de un producto interno sobre V. Este producto interno 
está dado por 

(alf) = Y*GX 


donde X e Y son las matrices de coordenadas de a y ff en la base ordenada GB. 


Ejercicios 


I. Seca V un espacio vectorial y ( | ) un producto interno sobre V. 
(a) Demostrar que (0|f) = O para todo $ de V. 
(b) Demostrar que si (alp) = 0 para todo ff de V, entonces x = 0. 


2. Sea V un espacio vectorial sobre F. Demostrar que la suma de dos productos internos 
sobre Y es un producto interno sobre V. ¿Es la diferencia de dos productos internos un 
producto interno? Mostrar que un múltiplo positivo de un producto interno es un pro- 
ducto interno. 


3. Describir explícitamente todos los productos internos sobre R' y sobre C'. 
4. Comprobar que el producto interno canénico sobre F" es un producto interno. 
8, Seca ( | ) el producto interno canónico sobre R?. 
fa) Sean x = (1, 2), p = (—1, 1). Si y es un vector tal que (a|y) = —1 y (Bly) EN 


hallar y. 
(b) Demostrar que para cada a en R? se tjene que « = (ae, )e, + (a€z)€z. 


b. Sea ( | ) el producto interno canónico sobre R? y sea T el operador lineal T(x,. x2) = 
Lx), x1). Ahora, Tes la «rotación en 90°» y tiene la propiedad de que (a|7x) = O para todo 
y en R?. Hallar todos los productos internos [ | ] en R? tales que [a|7a] = O para cada a. 


7. Sea ( | ) el producto interno canónico sobre C?. Demostrar que existe un operador 
lineal no nulo en C? tal que (a|7a) = 0 para cada a en C?. Generalizarlo. 


#8, Sca A una matriz 2 x 2 con elementos reales. Para X, Y en F?*?, sea 
Ja(X, Y) = Y'AX. 


Demostrar que f, es un producto interno sobre R?*? si, y solo si, A= A!, Aq, > 0, 
t,, >0 y det A > 0. 


Y. Sea V un espacio vectorial real o complejo con un producto interno. Demostrar que 
la forma cuadrática determinada por el producto interno cumple la ley del paralelogramo 


lla + Bil? + lla — Bell? = 2llall? + 211811. 


10. Sca ( | ) el producto interno sobre R? definido en el Ejemplo 2 y sea 63 la base or- 
denada canónica de R?. Hallar la matriz de este producto interno con respecto a GB. 
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11. Mostrar que la fórmula 


IS dy = y Gh 
G arig oa) 2 


define un producto interno sobre el espacio R[x] de los polinomios sobre el cuerpo R. Sea 
W el subespacio de los polinomios de grado menor o igual que ». Restringir el producto 
interno anterior a W y hallar la matriz de este producto interno sobre W respecto a la base 
ordenada {1, x, ..., x”). (Sugerencia: Para mostrar que la fórmula define un producto 
interno, obsérvese que 


ula = ¿1000 d 


y Operar con la integral.) 


12. Sea V un espacio vectorial de dimensión finita y sea @ = [a,....., q.) una base de V. 
Sea ( | ) un producto interno sobre V. Si ¢,, .. . , c, son n escalares arbitrarios, demostrar 


que existe exactamente un vector & en V tal que (ala) = E A 


13. Sea V un espacio vectorial complejo. Una función J de V en V se llama 
si Ha + P) = Ja) + IP), Sica) = cJa) y Ja) = a para todo ¢ y todo a, ff en V. Si 
J es una conjugación, demostrar que 

(a) El conjunto W de todos los a en V tales que Ja = a es un espacio vectorial sobre 
R con respecto a las operaciones definidas en Y. 

(b) Para cada a en V existen vectores únicos f, y en W tales que a = f + iy. 


14. Sean V un espacio vectorial complejo y W un subconjunto de V con las siguientes 
propiedades: 
(a) W es un espacio vectorial real con respecto a las operaciones definidas en V. 
(b) Para cada « en V existen vectores únicos f, y en W tales que æ = f + iy. Demos- 
trar que la ecuación Ja = ff — i; define una conjugación en V tal que Jæ = a si, y solo si, 
z% pertenece a W y mostrar también que J es la única conjugación en V con esta propiedad. 


15. Hallar todas las conjugaciones en C* y C?, 


16. Sea W un subespacio real de dimensión finita de un espacio vectorial complejo Y. 
Demostrar que W satisface la condición (b) del Ejercicio 14 si, y solo si, cada base de W es 
también una base de V. 


17. Scan V un espacio vectorial complejo. J una conjugación sobre V, W el conjunto 
de los x de V tales que Jx = x y f un producto interno sobre W. Demostrar que: 

(a) Existe un producto interno único g en V tal que glo, B) = fía, P) para todo 
x P en W. 

(b) glJa, JB) = g(fB. a) para todo a, f en V. 
¿Qué dice la parte (a) respecto a la relación entre los productos internos canónicos sobre 
R! y C! o sobre R" y Œ"? 


8.2. Espacios producto interno 
/ 
Ahora que se tiene una idea de lo que es un producto interno, se atenderá 
a lo que se puede decir al respecto de la combinación de un espacio vectorial 
y un producto interno particular sobre el mismo. Específicamente se estable- 
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verán las propiedades básicas de los conceptos de «longitud» y «ortogonali- 
dad» que son impuestos al espacio por el producto interno. 


Definición. Un espacio producto interno es un espacio real o complejo junto 
con un producto interno definido sobre ese espacio. 


Un espacio producto interno real de dimensión finita se llama a menudo 
espacio euclidiano. Un espacio con producto interno complejo se llama a veces 
espacio unitario. 

Teorema 1. Si V es un espacio producto interno, entonces para vectores 
1, [$ cualesquiera de V y cualquier escalar c 


© Jlcall = le] lell; 

(ii) [Ja]] > O para a + 0; 
in lA] < llel] Ili; 
v) lla + Al < llall + Ill- 


Demostración. Las afirmaciones (i) y (ii) se desprenden casi inmediatamen- 
te de las varias definiciones vistas. La desigualdad en (iii) es claramente válida 
para a = 0. Si « + 0, hágase 


a 


_ Olo) 
A der 


Entonces (yj) = 0 y 


¿(0 _ Cl „lg Eld 
os iml = (s - feele- ape) 
= (818) — Cale 
= iae — KARE. 


Luego |(al£)|? < lla]|?]I8I]?. Ahora usando (c) se tiene que 


lla + fll? = llall? + (al6) + (Bla) + llall? 
= lla]? + 2 Re (al) + llel}? 
< llall? + 2 le! 11811 + liell? 
= (llal] + 1810”. 


con lo que lloc EF Bl < llall t I18ll- I 


La desigualdad en (iii) se llama desigualdad de Cauchy-Schwarz y tiene una 
amplia variedad de aplicaciones. La demostración muestra que si (por ejemplo) 
x es cero, entonces |(«|f)| < [Jal] |]8]] a menos que 


_ lo) 
B = aga e 
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Asi, la igualdad se tiene en (iii) si, y solo si, a y f son linealmente dependientes. 


Ejemplo 7. Si se aplica la desigualdad de Cauchy-Schwarz al producto 
interno dado en los Ejemplos 1, 2, 3 y 5 se obtiene lo siguiente 


(a) [Z aga] < (2 la) E [ye] 
(b) [z — T — tiy + ATY 

< ((z1 — 22)? + 32%) 2((y — ya)? + 343)" 
(c) [tr (4B*)| < (tr (4A*))"2(tr (BB*))u2 


D oras (fora) (f wor de)”. 


Definiciones. Sean a y B vectores de un espacio producto interno V. Entonces 
a es ortogonal a $ si (af) = 0; como esto implica que ß es ortogonal a a, a menu- 
do solo se dirá que a y B son ortogonales. Si S es un conjunto de vectores de V, se 
dice que S es un conjunto ortogonal siempre que todos los pares de vectores dis- 
tintos de S sean ortogonales. Un conjunto ortonormal es un conjunto ortogonal 
S con la propiedad además de que lla]] = 1 para todo a de S. 


El vector cero es ortogonal a todo vector en Y y es el único vector con esa 
propiedad. Es apropiado pensar un conjunto ortonormal como conjunto de 
vectores mutuamente perpendiculares que tienen longitud 1. 


Ejemplo 8. La base canónica en R" o C" es un conjunto ortonormal con 
respecto al producto interno canónico. 


Ejemplo 9. El vector (x, y) de R? es ortogonal a (—y, x) con respecto 
al producto interno canónico; en efecto, 
(a, Nl=y 0) = —ay + yz =p 


Sin embargo, si R? está dotado del producto interno del Ejemplo 2, entonces 
(x, y) y (—y, x) son ortogonales si, y solo si, 
Y = ¿(-3 + Vl3). 
Ejemplo 10. Sea Y = C"*" el espacio de las matrices complejas n x n, 
y sea E”-* la matriz cuyo único elemento no nulo es un 1 en la fila p y la columna q. 


Entonces el conjunto de todas las matrices E?2 es ortonormal con respecto al 
producto interno dado en el Ejemplo 3. En efecto, 


(Em Er) = tr (Emo) = ôq tr (EP) = 8q0bpr. 


Ejemplo 11. Sea V el espacio de las funciones continuas de valor complejo 
(o valor real) en el intervalo 0 < x < 1 con el producto interno 


010 = [1075 az. 


o 


Supóngase que fa(x) = V2 cos 2rnx y que galz) = V2 sen 2nnx. Entonces 
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HAr da e ' es un conjunto infinito ortonormal. En el caso complejo 
se pueden formar también las combinaciones lineales 


1 3 
Z A O a 
Pti, n=1,2, 


De este modo se tiene un nuevo conjunto ortonormal S que consta de todas 
las funciones de la forma 


ha) = e n = EHE.. 


El conjunto S’ que se obtiene de S adjuntando la función constante 1 es también 
ortonormal. Se supone aquí que el lector está familiarizado con el cálculo de 


las integrales en cuestión. 


Los conjuntos ortogonales dados en los ejemplos anteriores son todos lineal- 
mente independientes. Se ve ahora que necesariamente éste es el caso. 


Teorema 2. Un conjunto ortogonal de vectores no nulos es linealmente 
independiente. 

Demostración. Sea S un conjunto ortogonal finito o infinito de vectores 
no nulos en un espacio con producto interno dado. Supóngase que 0, Az, - - - > Om 
son vectores distintos en S y que 


B = cion + (202 + -** + CnOm. 
Entonces 


(Blax) = z cjoy|ax) 


= Y cjla;lar) 


cios lar). 
Como (xla) + 0, se sigue que 


Así, cuando f = 0, cada e, = 0, de modo que S es un conjunto independiente. $ 


Corolario. Si un vector ff es combinación lineal de una sucesión ortogonal 


7 inación lineal 
de vectores no nulos Uy, ..., Om, entonces B es igual a la comb 
particular 
m (Blas) 
E = y) Qk. 
el P= 2, Ted 


Este corolario se desprende de la demostración del teorema. Hay otro co- 
rolario que mencionar que es también obvio. Sir 25 Am} es un conjunto 
ortogonal de vectores no nulos en un espacio con producto interno de dimen- 
sión finita V, entonces m < dim V. Esto dice que el número de direcciones 
mutuamente perpendiculares en V no pueden exceder la dimensión algebraica- 


Eze N — ak 


Algebra linval 
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mente definida de V. El máximo número de direcciones mutuamente perpen- 
diculares en V es lo que intuitivamente se considera como dimensión geomé- 
trica de V, y se acaba de ver que ésta no es mayor que la dimensión algebraica. 
El E S dos dimensiones sean iguales es un corolario particular del siguiente 
resultado. 


Teorema 3. Sea V un espacio con producto interno y sean ß,, ..., B, vec- 
tores independientes cualesquiera de V. Entonces se pueden construir vectores 
ortogonales &;, ..., 0, en V tales que para cada k = 1,2, ...,n el conjunto 


(0 > 0%) 
sea una base del subespacio generado por B,, ..., Br. 

Demostración. Los vectores œ, ..., 0, se obtendrán por medio de una 
construcción conocida como proceso de ortogonalización de Gram-Schmidt. 
Primero, sea a, = ff,. Los otros vectores están entonces dados inductivamente 
de la siguiente forma: supóngase que %%;, ..., Om (1 < m < n) hayan sido ele- 
gidos de modo que para cada k 

{an-ı ax}, 1<k<m 


es una base ortogonal para el subespacio de V que es generado por f,,...., Ph- 
Para construir el siguiente vector 0,,,,, sea 


(8-9) Ampi = Bm — 2 Fe Qk. 

Entonces &m+ı + 0. En efecto, ya que en caso contrario Q,,,, es una combi- 
nación lineal de los &;, . . . , %n y luego una combinación lineal de los %,,...., Om- 
Además, si 1 < j < m, entonces 


(anla) = Ganla) — E, ERP Ca) 


= (Banla) — (Basila) 


Por tanto, {&;, . -., %,+1) es un conjunto ortogonal que consta de m + 1 vec- 
tores no nulos en el subespacio generado por f,, .. ., Pm+1. Por el Teorema 2, 
él es una base para este subespacio. Así los vectores &;, ..., 0, pueden cons- 
truirse uno tras otro de acuerdo con (8-9). En particular, cuando n = 4, se 


tiene 
= Bi 
a = Ba — Gala a 
(8-10) 
TEE (Bala) é (Balaz) > 
llel Tol 0 
— g, — balas) (Blaz) (Balas) 
he — Jele “T Te T Te T 
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Corolario. Todo espacio con producto interno de dimensión finita tiene una 
base ortonormal. 


Demostración. Sean V un espacio con producto interior de dimensión 
finita y (f,, - - -, B,) una base para V. Aplicando el proceso de Gram-Schmidt, 
se construye una base ortogonal {¢, . . . , %,). Entonces, para obtener una base 
ortonormal, se remplaza simplemente cada vector a, por ox/||ærl]- 


Una de las ventajas principales que tienen las bases ortonormales sobre 
las bases arbitrarias es que los, cálculos en que entran coordenadas son más 
simples. Para indicar en términos generales por qué es así, supóngase que V es 
un espacio con producto interior de dimensión finita. Entonces, como en la 
última sección, se puede usar (8-5) para asociar la matriz G con cada base orde- 
nada BG = (0, ..., On} de V. Usando esta matriz 

Gi = (aula;), 
se puede calcular el producto interno en términos de las coordenadas. Si GB es 
una base ortonormal, entonces G es la matriz unidad, y para cualesquiera 
escalares xj € yy 
a zal? Yar) = z Tiii. 


Con lo que, en términos de una base Anoa! el producto interno en V se 
asemeja al producto interno canónico en F”. 

Aunque es poco útil para los cálculos, es interesante observar que el pro- 
ceso de Gram-Schmidt puede ser también usado como criterio de independen- 
cia lineal. En efecto, supóngase que f,, .... Pa son vectores linealmente de- 
pendientes en un espacio con producto interno V. Para excluir el caso trivial, 
supóngase que f, + 0. Sea m el mayor entero para > que los $i, ..., Bm son 
independientes. Entonces 1 < m < n. Sean dı, ... „n los vectores obtenidos 
por la aplicación del proceso de ortogonalización a E Bi, - - -> Bm- Entonces 
el vector 0, +, dado por (8-9) es necesariamente 0. En efecto, a Om+ 1 está en el 
subespacio generado por %;, ..., 0%, y es ortogonal a cada uno de estos vec- 
tores: Juego es-0 por (8-8). Recíprocamente, Si Xt, ... . , %n Son distintos de 0 y 
Xm+1 = 0, entonces $, ..., Bm+1 Son linealmente dependientes. 


Ejemplo 12. Se consideran los vectores 


Bı = (3,0, 4) 
fa = (-1,0,7) 
Bs = (2, 9, 11) 


en R? con el producto interno canónico. Aplicando el proceso de Gram-Schmidt 


a los B,, B2, B3, se obtienen los siguientes vectores 
a = (3,0, 4) 
so es AS ((=1, 0, 7163, 0 


2) 
L (3, 0, 4) 


A AAA 
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= (2,9, 11) — (Q.9 1DIG, O, 4) 


a = 25 6, 0, 4) 
— (Q, 9, 11)|(—4, 0, 3) 
E (4, 0, 3) 
= (2, 9, 11) — 2(3, 0, 4) — —4, 0, 3) 


= (0, 9, 0). 


Estos vectores son evidentemente no nulos y mutuamente perpendiculares. 
Luego [0t,, %,, %3) es una base ortogonal para R?, Para expresar un vector ar- 
bitrario (1, Xa x) en R? como combinación lineal de los œ, d,, az no es ne- 
cesario resolver ninguna ecuación lineal. Para ello es suficiente usar (8-8). Así, 


(21, Za, 23) 
como se verifica rápidamente. En particular, 
(1, 2,3) = 3 (3,0, 4) + 3 (-4,0, 3) + 2 (0, 9, 0). 


Para ver esto desde otro punto de vista, lo que se tiene es lo siguiente: la base 
Si Sa, Ja} de (R?)*, que es dual de la base [0,, d,, 03), está definida explici- 
tamente por: 


Silan T; 3) E Sutin 
Salti, ta, 23) = zintan 
Saltu ta, 19) = E 


y estas ecuaciones pueden ser escritas en forma más general como 


((2,, to, 23) |0,). 
lla,11? 


Finalmente, obsérvese que de a,, «z, q, se tiene la base ortonormal 


Silt Ta, 23) = 


3 (3,0,4), $(-4,0,3), (0,1,0). 


Ejemplo 13. Sea A = [s e , donde a, b, c y d son números comple- 


jos. Se hace f, = (a, b), Ba = (c, d) y se supone que f, + O. Si se aplica el pro- 
ceso de ortogonalización a f,, $}, usando el producto interno canónico en C?, 


se obtienen los siguientes vectores 


o = (a,b) 
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((c, d)|(a, DJ) 


a: = (e, d) — jaje + lee (a, b) 
(ca + db) 
= (c, d) — Jal? + Jbl? (a, b) 


(a — dba daa — ea) 

Ja + [0]? Jaf? + [oP 
_ detA 
— le? + [bl 

Ahora la teoría general dice que a, + 0 si, y solo si, f,, 2 son linealmente 


independientes. Por otro lado, la fórmula para a, muestra que este es el caso 
si, y solo si, det A + 0. 


Gi, a). 


En esencia, el proceso de Gram-Schmidt consiste en la aplicación repetida 
de una operación geométrica básica llamada proyección ortogonal, y se le en. 
tiende mejor desde este punto de vista. El método de la proyección ortogonal 
también aparece en forma natural en la solución de un importante problema 
de aproximación. 

f Supóngase que W es un subespacio de un espacio con producto interno V, 
y sea f un vector arbitrario en V. El problema consiste en hallar una mejor 
aproximación posible a f$ por vectores de W. Esto quiere decir que se desca 
encontrar un vector a para el que |] $ — a]| sea lo más pequeño posible, sujeto 
a la restricción de que a debe pertenecer a W. Precisemos lo dicho. 

Una mejor aproximación a f3 por vectores de W es un vector « de W tal que 


118 — all < 118 — ll 
para todo vector y en W. 

Observando este problema en R?, o en R?, se ve intuitivamente que Una 
mejor aproximación a f por vectores de W debe ser un vector a de W tal que 
ff — a es perpendicular (ortogonal) a W y que tal a. debe ser único. Estas ideas 
intuitivas son correctas para subespacios de dimensión finita y para algunos, 
pero no todos, los subespacios de dimensión infinita. Dado que la situación 
precisa es demasiado complicada de tratar aquí, se demostrará solo el siguien- 
te resultado. 


Teorema 4. Sea W un subespacio de un espacio producto interno V y sea B 
un vector de V. 


(i) El vector « en W es una mejor aproximación a f, por vectores de W 
si, y solo si, B — a es ortogonal a todo vector de W. 
(ii) Si existe una mejor aproximación a P por vectores de W es única. 
(iii) Si W es de dimensión finita y {%;, -.., On} es cualquier base ortonor- 
mal de W, entonces el vector 


(Blow) 


a =,2 j2 * 


se llel 


es la (única) mejor aproximación a ß por vectores de W. 
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Demostración. Primeramente, obsérvese que si y es cualquier vector de Y. 
entonces f — y = (P — a) + (a — y), y 


llie — vll? = 118 — all? +2 Re (8 — ala — y) + lla — y 12. 


Supóngase ahora que $ — a es ortogonal a todo vector de W, que y está en W y 
que y + a. Entonces, como a — y está en W, se sigue que 


116 — vll? = |l — all? + lle — vll? 
> 118 — al|?. 


Recíprocamente, supóngasc que || — yl] > [IB — al] para todo y en E. 
Entonces de la primera ecuación anterior se sigue que 


2 Re (8 — ala — y) + lla — yl]? > 0 


para todo y de W. Como todo vector de W puede ser expresado en la forma 
a — y con y en W, se ve que 


2 Re (8 — alz) + Ilr? > 0 
para todo t en W. En particular, si y está en W y y + a, se puede tener 


(8 — ala — y) 
[la — vll? 
Entonces, la desigualdad se reduce a la afirmación 


3 M6 ala — ly 1B — ale = dl- 9, 
lla — yl? AS 
Lo cual se cumple si, y solo si, (8 — ajo — y) = 0. Por tanto, B — a es orto- 
gonal a todo vector en W. Esto completa la demostración de la equivalencia 
de las dos condiciones para a. dadas en (i). La condición de ortogonalidad es 
evidentemente satisfecha por, a lo más, un vector de W, lo que demuestra (ii). 
Ahora supóngase que W es un subespacio de dimensión finita de V. Enton- 
ces se sabe, por un corolario del Teorema 3, que W tiene una base ortogonal. 
Sea [a;, ..., 0%) cualquier base ortogonal para W, y se define « por (8-11). 
Entonces, por el cálculo hecho en la demostración del Teorema 3, P—aues 
ortogonal a cada uno de los vectores a, ($ — a es el vector obtenido en la últi- 
ma etapa cuando se aplica el proceso de ortogonalización a œ}, ..., T PB). 
Así ß — « es ortogonal a toda combinación lineal de los Olga: < = a Uy, ¿eS decin; 
a todo vector en W. Si y está en W y y + a, se sigue que |]f — yll > [18 — adj. 
Por tanto, a es la mejor aproximación a f que está en W. 


T= (a — y). 


Definición. Sea V un espacio producto interno y S cualquier conjunto de 
vectores en V. El complemento ortogonal de S es el conjunto S* de los vectores 
de V ortogonales a todo vector de S. 


El complemento ortogonal de V es el subespacio cero y, recíprocamente, 
10)" = V. Si S es cualquier subconjunto de V, su complemento ortogonal S* 
(S perp) es siempre un subespacio de V. En efecto, como S+ no es vacio, por 


PEE ooa ARA y 
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contener al 0, y toda vez que a y f están en S+ y c es escalar cualquiera, se 
tiene 


claly) + (el) 
=0+0 
= 0 


(ca + Blv) 


para cada y en S, así cx + f también está-en S+. En el Teorema 4,.la propie- 
dad característica del vector œ es que es el único vector de W tal que f — a per- 
tenece a W+ 


Definición. Siempre que exista el vector a en el Teorema 4 se le llama proyección 
ortogonal de $ sobre W. Si todo vector de V tiene proyección ortogonal sobre W, 
la aplicación que asigna a cada vector de V su proyección ortogonal sobre W, se 
llama proyección ortogonal de V sobre W. 


Por el Teorema 4, la proyección ortogonal de un espacio producto interno 
sobre un subespacio de dimensión finita siempre existe. Pero el Teorema 4 también 
implica el siguiente resultado. 


Corolario. Sean V un espacio producto interno, W un subespacio de dimen- 
sión finita y E la proyección ortogonal de V sobre W. Entonces la aplicación 


B=B— EP 
es la proyección ortogonal de V sobre W+. 
Demostración. Sea ff un vector arbitrario de V. Entonces f — Ef está 


en W y para cualquier y en W+, P — y = EB + (B — Ef — y). Como Ef está 
en W y B — Ef — y está en W+, se sigue que 


118 — vll? = J[Egll? + ll6 — £8 — vll? 
> 116 — (8 — EB)lI? 
que hace más estricta la desigualdad cuando y + f 3 Ef. Por tanto, 8 — Ef 
es la mejor aproximación a f para vectores en W`. 


Ejemplo 14. Se da a R? el producto interno canónico. Entonces la pro- 
vección ortogonal de (—10, 2, 8) sobre el subespacio W generado por (3, 12, — í) 
us el vector 

((—10, 2, 8)1(3, 12, 


=D) > 
a= o4 I4 F] (3, 12, —1) 


ELA 

154 
La proyección ortogonal de R? sobre W es la transformación lineal E defini- 
da por 


(3, 12, —1). 


12% — z: c 
Cia a (2 ») (3, 12, —1). 


bA 


A A A AS > =. 
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La imagen de £ es evidentemente 1; luego su nulidad es 2. Por otro lado. 
Elx, 22, z3) = (0, 0, 0) 


si, y solo si, 3x, + 12x, = x, = 0. Este es el caso si, y solo si, (x1, X2, x3) está 
en W*. Por tanto, W+ es el espacio nulo de £, y dim (W +) = 2. Calculando 


(21, Le, 25) — (+=) (3, 12, —1) 


se ve que la proyección ortogonal de R? sobre W+ es la transformación lineal 
I — E que aplica el vector (x,, x2, x3) sobre el vector 


ggg (45m — 36x + Bas, 360 + 100 + 1220, 321 + 1203 + 1581). 


Las observaciones hechas en el Ejemplo 14 se generalizan de la siguien- 
te forma. 


Teorema 5. Sea W un subespacio de dimensión finita de un espacio pro- 
ducto interno V y sea E la proyección ortogonal de V sobre W. Entonces E es una 
transformación lineal idempotente de V sobre W, W+ es el espacio nulo de E y 


V= wọ. 


Demostración. Sea ß un vector arbitrario en V. Entonces Eß es la mejor 
aproximación a ff que está en W. En particular, Ef = f cuando f está en W. 
Por tanto, E(Ef) = Ef para todo f en V; esto es, E es idempotente: E? = E. 
Para demostrar que Æ es una transformación lineal, sean a y B vectores cuales- 
quiera de V y c un escalar arbitrario. Entonces, por el Teorema 4, a — En y 
P — Ef son ambos ortogonales a todo vector de W. Luego el vector 


cla — Ba) + (B — EP) = (ca + B) — (cEa + EB) 


también pertenece a W+. Como cEu + Ef es un vector de W, se sigue del Teore- 
ma 4 que 


Elca + 8) = cEa + Ef. 


Por cierto que se puede también demostrar la linealidad de E usando (8-1 1). 
Nuevamente, sea £ un vector cualquiera de V. Entonces E es el vector único 
de W tal que $ — Ef está en W+. Así, Ef = 0 cuando f está en W.. Recípro- 
camente, f está en W+ cuando Ef = 0. Así W! es el espacio nulo de E. La 
ecuación 


B = E +8 — Eg 


muestra que V = W + W+; más aún, W M W* = {0}. En efecto, si a es un 
vector de W AN W+, entonces (aja) = 0. Por tanto, « = 0 y V es la suma di- 
recta de W y w+. I 


Corolario. Bajo las condiciones del teorema, I — E es la proyección orto- 
gonal de V en W+. El es una transformación lineal idempotente de V en W* con 
espacio nulo W. 


SA BE Ao a a 
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Demostración. Acabamos de ver que la aplicación f => $ E Er es la proa 
yección ortogonal de Y sobre W+. Como E es una transformación lineal, esta 
proyección en W* es la proyección lineal 7 — E. Por sus propiedades geomé- 
Iricas se ve que 7 — E es una transformación idempotente de V sobre W. Esto 
también se desprende del cálculo 

(—EDU-E)=1-E-E+E 
=1-—E. 


Además, (Z — E)B = 0 si, y solo si, B = EP, y este es el caso si, y solo si, f está 
en W. Por tanto, W es el subespacio nulo de 7 — E. | 


El proceso de Gram-Schmidt puede ser ahora descrito geométricamente 


del siguiente modo. Dado un espacio producto interno V y los vectores ĝi... -> f 
en V, sea P, (k > 1) la proyección ortogonal de V en el complemento ortogona 
del subespacio generado por By, .. ., Pk-1ı y sea P, = L Entonces, los vectores 
que se obtienen por aplicación del proceso de ortogonalización a fi, >- -> Pn 
están definidos por las ecuaciones 

(8-12) ar = PiBr, 1<k<m. 


El Teorema 5 implica otro resultado conocido como desigualdad de Bessel. 
Corolario. Sea {œ .... Xn} un conjunto ortogonal de vectores no nulos 
en un espacio producto interno V. Si f es cualquier vector de V, entonces 


<A 


v la desigualdad vale si, y solo si, 


Demostración. Sea y = z [lalla] 0. Entonces f = y + ð, donde 
(y]9) = 0. Luego 
11611? = Illl? + [lo]1?. 


Es ahora suficiente demostrar que 


Ime = y CL. 


z lloll? 
Este es el cálculo rutinario en el que se usa el hecho de que (|a) = 0 para 
j#k. l 
En el caso especial en que (%;, -- -, %,) es un conjunto ortonormal, la des- 
igualdad de Bessel dice que 
2 [(6law)I? < Ilgi]? 
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El corolario dice también, en este caso, que f está en el subespacio generado 
por (01, ..., 0) si, y solo si, 


B= z Blar) œ 


o si, y solo si, la desigualdad de Bessel es efectivamente una igualdad. Por cier- 
to que en el caso en que V sea de dimensión finita y (01, ..., an} es una base 
ortogonal de V, la fórmula anterior rige para todo vector f en V. En otras pa- 


labras; si (0, ..., 0,) es una base ortonormal de V, la k-ésima coordenada 
de f en la base ordenada (Q,,..., an} es (Blox). 


h Ejemplo 15. Se aplicará el último corolario al conjunto ortogonal des- 
crito en el Ejemplo 11. Hallamos que 


2 e | 
(2) ¿E Ji oeral < [ora 
(b) 14 A cremita” dt = de lcz]? 


(c) a (V2 cos 2mt + V2 sen 41). dt=1+1=2, 


Ejercicios 


1. Considerar R*, con el producto interno canónico. Sea W el subespacio de R* que consta 
5 todos los vectores ortogonales a a = (1, 0, —1, 1) y $ = (2, 3, —1, 2). Hallar una base 
e W. 


2. Aplicar el proceso de Gram-Schmidt a los vectores 8, = (1, 0, 1), Bı = (1, 0, —1) 
. Pa = (0, 3, 4) para obtener una base ortogonal para R? con el producto interno canónico. 


3. Considerar C? con el producto interno canónico. Hallar una base ortonormal para 
el subespacio generado por Pı = (1, 0, i) y B = (2,1, 1+ i). 


4. Sea Y 


un espacio producto interno. La distancia entre los vectores cr 
finida por sa y f en V está de- 


dla, B) = lla — fll. 


Demostrar que 
(a) dia, f) > 0; 
(b) día, P) = 0 si. y solo si, a = B; 
(c) día, p) = dB, a); 
(d) dix, p) < día, y) + dy, B). 


5. Sea V un espacio producto interno y sean a, B vectores de V. Demostrar que a = f 
si, y solo si, (ay) = (fly) para todo y de F. 


po ARA ARA AA EA EOEQ E > 
Espacios con producto interno 


6. Sea W el subespacio de R? generado por el vector (3, 4). Usando el producto interno 
mico, sea E la proyección ortogonal de R? sobre W. Hallar 

ta) una fórmula para E(x,.x2): 

(b) la matriz de E en la base ordenada vanónica; 

w) W+; 

(d) una base ortonormal en que E está representada por la matriz 


[o e] 

o oF 

7. Sea V el espacio producto interno que consta de R? y el producto interno cuya forma 
cuadrática está definida por 


Ias zal? = (a — 22)? + 323. 


Sea E la proyección ortogonal de V sobre el subespacio W generado por el vector (3, 4). 
Responder ahora las cuatro preguntas del Ejercicio 6. 


8. Hallar un producto interno sobre R? tal que (€, €,) = 2. 


9. Sea V el subespacio de polinomios R[x] con grado a lo más 3. Dótese V con el pro- 
ducto interno 


Yo = f; 10% a. 


(a) Hallar el complemento ortogonal del subespacio de polinomios escalares; 
(b) Aplicar el proceso de Gram-Schmidt a la base (1, x, x°, x°}. 


10. Sea V el espacio vectorial de todas las matrices n x n sobre C, con el producto inter- 
no (4|B) = tr (4B*). Hallar el complemento ortogonal del subespacio de matrices dia- 
gonales. 


11. Sea V un espacio producto interno de dimensión finita y sea (a, ..., %,) una base or- 
tonormal de V. Demostrar que para vectores a, ff cualesquiera de V 


(016) = È, (alante. 


12. Sea W un subespacio de dimensión finita de un espacio producto interno V y sea E 
la proyección ortogonal de Y sobre W. Demostrar que (Ex) 8). = (a Ep) para todo a, Ben V. 


13. Sea S un subconjunto de un espacio producto interno Y. Demostrar que (S*)* con- 
tiene al subespacio generado por S. Cuando V es de dimensión finita, mostrar que (S*)* 
es el subespacio generado por S. 


14. Sea V un espacio producto interno de dimensión finita y sea @ = [a,,..., €n} una 
base ortonormal de V. Sea T un operador lineal sobre V y A la matriz de T en la base or- 
denada @. Demostrar que 


As; = (Tajla). 


15. Supóngase que V = W, O W, y que fı y fı son productos internos en W, y Wz, 
respectivamente. Demostrar que existe un producto interno único f sobre V tal que 
(a) W = Wi; 
(b) fía, f) = fila, P), cuando a, $ están en Wy, k = 1, 2. 


16. Sea V un espacio producto interno y W un subespacio de V de dimensión finita. Exis- 
ten (en general) muchas proyecciones que tienen a W como imagen. Una de éstas, la pro- 


ES 
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yección ortogonal sobre W, tiene la propiedad de que ||£x|| < |la]| para todo a de Y. De- 
mostrar que si £ es una proyección con imagen W, tal que [|£x]| < |jæ|| para todo « de Y, 
entonces E es la proyección ortogonal sobre W. 


17. Sea V el espacio prodlcto interno real que consta del espacio de las funciones conti- 
nuas de valor real en el intervalo —1 < 1< 1, con el producto interno. 


día = fi IOO a. 


Sea W el subespacio de las funciones impares, es decir. las funciones que satisfacen f(—1) = 
— f(t). Hallar el complemento ortogonal de W. 


8.3. Funciones lineales y adjuntas 


La primera parte de esta sección se dedicará a los funcionales lineales sobre 
un espacio producto interno. El resultado principal es que cualquier funcional 
lineal f sobre un espacio producto interno de dimensión finita es «un producto 
interno con un vector fijo en el espacio»; es decir, que tal f tiene la forma fæ) = 
(al P) para algún £ fijo de V. Se usará este resultado para demostrar la existencia 
del «adjunto» de un operador lineal T sobre V, siendo éste un operador lineal 
T* tal que (Ta]8) = («| T*B) para todo « y f en V. Por el uso de una base or- 
tonormal, esta operación adjunta sobre operadores lineales (que pasa de T 
a T*) se identifica con la operación de formar la transpuesta conjugada de una 
matriz. Exploramos someramente la analogía entre la operación adjunta y la 
conjugación de números complejos. 

Sea V cualquier espacio producto interno y sea $ un vector fijo de V. Se 
define una función :f, de V en el cuerpo escalar por 


fela) = (alg). 


Esta función fg es un funcional lineal sobre V, ya que por su propia definición, 
(a]f$) es lineal como función de a. Si V es de dimensión finita, todo funcional 
lineal sobre Y se puede expresar de esta forma para cierto f. 


Teorema 6. Sean V un espacio producto interno de dimensión finita y f un 
funcional lineal sobre V. Entonces, existe un único vector ß de V tal que fla) = (lf) 
para todo x de V. 


Demostración. Sea (%,, dz, ..-, 0%) una base ortonormal de V. Se hace 


(8-13) B= 


j 


M= 


Sla;)a; 


1 


y sea fp el funcional lineal definido por 


Jola) = (alB). 


Entonces 


falar) = (a Z Fle;)o;) = fas). 


Espacios con prometa merno 280 


Como esto es cierto para todo gp, se sigue que f = fp. Ahora supóngase que 
y es un vector de V para el que («|$) = (a|)) para todo a. Entonces B- y18 = 
7) = 0 y $ = y. Así existe exactamente un vector $ que determina al funcional 
lincal f en la forma establecida. | 


La demostración de este teorema puede alterarse ligeramente en el caso de 
la representación de los funcionales lineales en una base. Si se elige una base 
ortonormal ([%,, ..., @n} para V, el producto interno de a = xı% +: + 
Xan Y B = Y10 F >> 0 + Yaa Será 


(alb) = uh +++: + Enin- 
Si f es un funcional lineal cualquiera sobre V, entonces f tiene la forma 
fla) = 401 + >> + CnTn 


para escalares fijos C}, .... C, determinados por la base. Ciertamente, c) = 
f(x). Si se desea encontrar un vector f en V tal que (|f) = fla) para todo a, en- 
tonces es evidente que las coordenadas y; de f deben satisfacer J; = c; 0 yj = 
fia). Por consiguiente, 


B = Noa + --- + Nanjan 


es el vector que se desea. 

Unos comentarios al respecto. La demostración del Teorema 6 que se ha 
dado es muy breve, pero no resalta el hecho geométrico esencial de que f está 
en el complemento ortogonal del espacio nulo de f. Sea W el espacio nulo de f. 
Entonces V = W + W+ y f está completamente determinado por sus valores 
en WŁ. En efecto, si P es la proyección ortogonal de V sobre W+, entonces 


fla) = K(Pa) 


para todo a de V. Supóngase que f + 0. Entonces f es el rango 1 y dim (W+) = 1. 
Si y es otro vector no nulo cualquiera de W+, se sigue que 


_ (aly) 
Pa = Tie? 


para todo a en V. Así, 


19 = (alo) - [En 


para todo a, y B= [FOYI v- 


Ejemplo 16. He aquí un ejemplo que muestra que el Teorema 6 no es cier- 
to sin la suposición de que V es de dimensión finita. Sea V el espacio vectorial 
de los polinomios sobre el cuerpo de los números complejos, con el producto 
interno 


(lo) = f; KOO ae. 


a 
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Este producto interno también puede ser definido algebraicamente. Si 
f =E ax" y g = E byx*, entonces 


jk 


1 te 
Gl) = z FER ajb,.. 
Sea z un número complejo fijo y sea L el funcional lineal «evaluación en z`: 
LA) =$). 
¿Existe un polinomio g tal que (f|g) = L(/) para todo f? La respuesta es no; 
en efecto, supóngase que tenemos que 
1 e 
IO = [11070 as 


para todo f. Sea h = x — z, de modo que para cualquier f se tenga que (hf)=0. 
Entonces 


1 E 
0 = (i KOOD de 
para todo f. En particular, esto rige cuando f = Ag, con lo que 
1 , 
fi Wortocor ar = 0 


y así hg = 0. Como h + 0, debe tenerse que g = 0. Pero L no es el funcional 
cero; luego no existe tal g. 

Se puede generalizar algo el ejemplo para el caso donde L sea combinación 
lineal de evaluaciones puntuales. Supóngase que se eligen números complejos 
fijos Zi, ..., 2, y escalares ci ..., €, Y sea 


LP) = afla) + +++ + enfln). 


Entonces L es un funcional lineal en V, pero no existe g tal que L(f) = Cle), 
al menos que c, = c, =--> = C, = 0. Solo debe repetirse el razonamiento 
anterior con h = (x — z,) =+- (x — z,). 

Se vuelve ahora al concepto del adjunto de un operador lineal. 


Teorema 7. Para cualquier operador lineal T en un espacio producto in- 
terno de dimensión finita, existe un único operador lineal T* sobre V tal que 


(8-14) (Ta|f) = (a|T*p) 
para todo x, B de V. 
Demostración. Sea f un vector cualquiera de V. Entonces a —> (Talb) es 


un funcional lineal sobre V. Por el Teorema 6 existe un único vector f' en V tal 
que (Ta|f) = (|b) para todo a en V. Sea T* la aplicación ß— ß': 


p = 7%, 


Se tiene (8-14), pero se debe verificar también que 7* es un operador lineal. 
Sean f, y en V y sea c un escalar. Entonces para cualquier a, 


(a]T*(cB + y)) = (TaleB + y) 
(Talc) + (Taly) 
t(Tal8) + (Taly) 
= C(a]T*8) + (a]7*y) 
= (alcT*8) + (a|T*y) 
= (alcT*B + T*y). 


Asi, T*(ch + y) = CT*B + T*y, y T* es lineal. 

La unicidad de T* es inmediata. En efecto, para cualquier f en V, el vector 
I*f' está univocamente determinado como el vector f’ tal que (Talp) = (0]8") 
para todo «. E 


Il 


Teorema 8. Sea V un espacio producto interno de dimensión finita y sea 
Woo (x -.., On} una base (ordenada) ortonormal de V. Sea T un operador 
lineal sobre V y sea A la matriz de T en la base ordenada @. Entonces Ay; = 
ENCAN 


Demostración. Como @ es una base ortonormal, se tiene que 
n 
a= Y (alay)ar. 
k=1 
La matriz A está definida por 
n 
Ta; = È Aror 
k=1 
y como 


Ta; = 5 (Tajlar)ar 
k=1 


se tiene Az; = (Tajla). | 


Corolario. Sea V un espacio producto interno de dimensión finita y sea 
T un operador lineal sobre V. En cualquier base ortogonal de V la matriz de T* 
ws la conjugada de la transpuesta de la matriz de T. 


Demostración. Sea @ = {«;, ..., æy una base ortonormal de V, sea 
A = [T]lg y B = [7*]g. De acuerdo con el Teorema 8, 


Ar; = (Tajla) 
Bi, = (T*a¿ar). 
Por definición de T* se tiene que 


Bi, = (T*a¿[ax) 


[a T*a,) 


= (Torla; 


) 
As. 1 
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Ejemplo 17. Sea Y un espacio producto interno de dimensión finita y 
E la proyección ortogonal de V sobre un subespacio W. Entonces para los vec- 
tores « y f cualesquiera en V. 


(Eal8) = (EalEB + (1 — E)B) 
(Ea|Ef) 
(Ea + (1 — Ba] Ef) 
= (a|Ef). 
De la unicidad del operador E* se sigue que E* = E. Ahora considérese la 
proyección E descrita en el Ejemplo 14. Entonces 


es la matriz de E en la base ortonormal canónica. Como £ = E*, A es tam- 
bién la matriz de E*, y como A = A* esto no contradice el corolario anterior. 
Por otro lado, supóngase que 

a = (154,0, 0) 

a = (145, —36, 3) 

as = (—36, 10, 12). 
Entonces (%,, %,, 43) es una base, y 


Eo = (9, 36, —3) 

Ea: = (0, O, 0) 

Eas = (0, O, 0). 
Como (9, 36, —3) = —(154, 0, 0) — (145, —36, 2), la matriz B de E en la base 
fæi, 2, 3) está definida por la expresión: 


—1 0'0 
B=|-1 0 0Ẹ 
000 


En este caso B + B* y B* no es la matriz de E* = E en la base (0,, &2, 0%). 
Aplicando el corolario, se concluye que {&;, %,, 3) no es una base ortonormal. 
Esto es bastante obvio naturalmente. 


Definición. Sea T un operador lineal sobre un espacio producto interno V. 
Entonces se dice que T tiene un adjunto sobre V si existe un operador lineal T* 
sobre V tal que (Ta|8) = (a«|T*B) para todo a y B en V. 


Por el Teorema 7 todo operador lineal en un espacio con producto interno 
de dimensión finita V tiene un adjunto en V. En el caso de dimensión infinita, 
esto no es siempre cierto. Pero, en todo caso, existe a lo más un tal operador T*; 
cuando existe se le llama el adjunto de 7. 

Dos comentarios respecto al casó de dimensión finita. 


1. El adjunto de 7 depende no solo de T, sino también del producto 
interno. 


2. Como se vio en el Ejemplo 17, en una base ordenada arbitraria @, la 
relación entre [7 ]g y [7*]g es más complicada que la dada en el corolario 
anterior. 


Ejemplo 18. Sea Y = C"*! el espacio de las matrices complejas n x 1 
con el producto interno (Y | Y) = Y*X. Si A es una matriz n x n con elemen- 
tos complejos, el adjunto del operador lineal X — AX es el operador X>A*X, 
En efecto, 

(AXIY) = Y*AX = (A*P)*X = (X]4*P). 
El lector debe convencerse por sí mismo de que esto es realmente un caso es- 
pecial del último corolario. 


Ejemplo 19. Este es semejante al Ejemplo 18. Sea V = C”*" con el pro- 
ducto interno (4| B) = tr (B*A). Sea M una matriz n x n dada sobre C. El 
adjunto de la multiplicación a la izquierda por M es multiplicación a la izquier- 
da por M*. Naturalmente, «multiplicación a la izquierda por M» es el ope- 
rador lineal Lọ definido por Ly(4) = MA. 

(Lu(4)1B) = tr (B*(MA)) 
= tr (MAB*) 
= tr (AB*M) 
= tr (4A(M*B)*) 
= (AlLar*(B)). 


Así (Ly)* = Ly». En el cálculo anterior se usó dos veces la propiedad carac- 
terística de la función traza: tr (4B) = tr (BA). 


Ejemplo 20... Sea V el espacio de los polinomios sobre el cuerpo de los nú- 
meros complejos con el producto interno 


1 -y 
AD = [1050 dt. 
Si f es un polinomio f = E a,x*, se hace f = E á,x*. Esto es, f es el polino- 
mio cuya función polinomio asociada es la compleja conjugada de la de f: 


JO =J0, treal 
Se considera el operador «multiplicación por f», esto es, el operador lineal 
M, definido por (M,)(g) = fg. Entonces este operador tiene un adjunto, a 
saber, multiplicación por f. En efecto, 


LOI) = Gala) 
= f IOON ae 


= [0700] a 


= (gfh) 
= (g|M5(h)) 


y asi (M7)* = My. 


A TUN a pa bh. «bio A 
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Ejemplo 21. En el Ejemplo 20 se vio que algunos operadores en un espacio 
producto interno de dimensión infinita tiene un adjunto. Como se comentó 
anteriormente, otros no lo tienen. Sea V el espacio con producto interno del 
Ejemplo 20 y sea D el operador derivación en C[x]. Integrando por partes 
se tiene que 


(Dflg) = Fg) — SOJA(O) — ($|Dg). 


Se considera g fijo y se pregunta: ¿Cuándo existe un polinomio D*g tal que 
(Dflg) = (1|D*g) para todo f? Si tal D*g existe, se debe tener que 


($1D*g) = FI) — F(O0)9(0) — (S|Dg) 


(S1D*g + Dg) = f(1)g(1) — f(0)g(0). 


Con g fijo, L(f) = f(1)g(1) — f(0)g(0) es un funcional lineal del tipo consi- 
derado en el Ejemplo 16 y no puede ser de la forma L(f) = (|h) a menos que 
L = 0. Si D*g existe, entonces con h = D*g + Dg se tiene que L(f) = lh); 
por tanto, g(0) = g(1) = 0. La existencia de un polinomio apropiado D*g 
implica g(0) = g(1) = 0. Recíprocamente, si g(0) = g(1) = 0, el polinomio 
D*g = — Dg satisface (Dflg) = (Y/1D*g) para todo f. Si se elige cualquier g 
para el que g(0) 4 0 o g(1) + 0, no se puede definir propiamente D*g, con 
lo que se concluye que D na tiene adjunto. 

Se espera que estos ejemplos aclaren la comprensión de lo que es el adjun- 
to de un operador lineal. Se ve que la operación adjunta, que pasa de Ta T*, 
se comporta en forma un tanto semejante a la conjugación de números comple- 
jos. El siguiente teorema refuerza esta analogía. 


Teorema 9. Sea V un espacio producto interno de dimensión finita. Si T y 
U son operadores lineales sobre V y c es un escalar 
(i) (T + U)* = T* + U*; 
(ii) (cT)* = čT*; 
(iii) (TU)* = U*T*; 
WAP ER 
Demostración. Para demostrar (i), sean a y f vectores en V. Entonces 


((T + U)alb) = (Ta + Ual6) 
= (Tal8) + (Ual6) 
= (a]T*8) + (aJU*B) 
= (a|T*B + U*B) 
= (a[(T* + UN). 
De la unicidad del adjunto se tiene que (T + U)* = T* + U*. Se deja la de- 
mostración de (ii) al lector. De las relaciones 


(TUa|B) = (Uc|T*p) = (aJ U*T*6) 
(T*al6) = @lT*a) = (Téla) = (o]T8). E 


se obtienen (iii) y (iv). f 
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El Teorema 9 se enuncia a menudo como sigue: la aplicación T— T* es 
antiisomorfa lincal-conjugada de periodo 2. La analogía con la conjugación 
compleja, que se ha mencionado anteriormente, está por cierto basada en la 
observación de que la conjugación compleja tiene las propiedades (2, + 2 
ł = Z,, (122) = 2,27, 2 = z. Se debe ser cuidadoso y observar la inversión 
del orden en el producto que impone la operación adjunta: (UT)* = T*U*, 
Cuando se continúe con el estudio de los operadores lineales en un espacio 
producto interno, se ampliará más esta analogía. En estas líneas algo diremos 
äl respecto. Un número complejo z es real si, y solo si, z = Z. Se podría esperar 
que el operador lineal 7 tal que T = T* se comporte en forma semejante a 
los números reales. En efecto, es así. Por ejemplo, si T es un operador lineal 
sobre un espacio complejo producto interno de dimensión finita, entonces 


(8-15) T = U, + 10, 


donde U, = Uf y U, = Už. Así, en cierto sentido, T tiene una «parte real» 
y una «parte imaginaria». Los operadores U, y U, que satisfacen U, = Uf 
y Uz = Uf, y (8-15) son únicos y están dados por 

Ur => (THT 


Ü= ZT — T»). 


Un operador lineal 7 tal que T = 7* se llama autoadjunto (o hermítico). 
Si @ es una base ortonormal de V, entonces 
[T*]e = [7]á 
y así T es autoadjunto si, y solo si, su matriz en toda base ortonormal es una 
matriz autoadjunta. Los operadores autoadjuntos son importantes, no sola- 
mente porque suministran una especie de parte real y parte imaginaria para 
el operador general, sino también porque: (1) Los operadores autoadjuntos 
tienen muchas propiedades especiales. Por ejemplo, para un operador así, existe 
una base ortonormal de vectores propios. (2) Muchos operadores que surgen 
en la práctica son autoadjuntos. Las propiedades especiales de los operadores 
«utoadjuntos se considerarán más adelante. 


Ejercicios 
1. Sea V el espacio C? dotado del producto interno canónico. Sea T el operador lineal 
definido por Te, = (1. 2), Te, = (i. --1). Si x = (x,, x2), hallar T*a. 


2. Sca T el operador lineal en C? definido por Te, = (1 + i, 2), Te, = (i, i). Usando el 
producto interno canónico, hallar la matriz de 7* en la base ordenada canónica. ¿Conmuta 
T con T*? 
3. Sea V = C? con el producto interno canónico. Sea T el operador lineal sobre V cuya 
matriz en la base ordenada canónica está definida por 

An = 04, (1? = —1). 


Hallar una base para el espacio nulo de 7*. 
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4. Sean V un espacio producto interno de dimensión finita y 7 un operador lineal sobre 
V. Demostrar que la imagen por T* es el complemento ortogonal del espacio nulo de T. 


5. Scan V un espacio producto interno de dimensión finita y 7 un operador lineal sobre 
V. Si T es inversible, demostrar que T* es inversible y que (7*)* = (73%. 


6. Sean V un espacio producto interno y f, y vectores dados de V. Demostrar que Ta = 
(a|P)y define un operador lineal sobre V. Demostrar que T tiene un adjunto y dar explici- 
tamente 7*. 

Supóngase ahora que V = C" con el producto interno canónico ß = (Yı, ..., Yn) Y 
Y = (Xi +. -> Xa). ¿Cuál es el elemento j, k de la matriz de T en la base ordenada canónica? 
¿Cuál es el rango de esta matriz? 


7. Demostrar que el producto de dos operadores autoadjuntos es autoadjunto si, y solo si, 
los dos operadores conmutan. 


8. Sea V el espacio vectorial de los polinomios sobre R de grado menor o igual que 3 con 
el producto interno 


dio = f; KOO de 


Si 1 es un número real, hallar el polinomio g, de V tal que (/|g,) = /(t) para todo f de V. 


9. Sea V el espacio producto interno del Ejercicio 8 y sea D el operador derivación sobre 
V. Hallar D*. 

10. Sea V el espacio de las matrices n x n sobre los números complejos con el producto 
interno (4|B) = tr (4B*). Sea P una matriz dada en V, inversible, y sea Tp el operador 
lineal sobre V definido por Tp(4) = P7'AP. Hallar el adjunto de Tp. 


11. Sea Y un espacio producto interno de dimensión finita y sea £ un operador lineal 
idempotente sobre V; es decir, E? = E. Demostrar que E es autoadjunto si, y solo si. 
EE* = E*E. 

12. Sea V un espacio producto interno complejo de dimensión finita y sea T un operador 
lineal sobre V. Demostrar que T es autoadjunto si, y solo si, (Tajo) es real para todo 
a de V. 


8.4. Operadores unitarios 


En esta sección se considerará el concepto de un isomorfismo entre dos 
espacios producto interno. Si Y y W son espacios vectoriales, un isomorfismo 
de Y sobre W es una transformación lineal inyectiva de Y sobre W; es decir, 
una correspondencia biunívoca entre los elementos de V y de W que «preser- 
van» las operaciones de espacio vectorial. Ahora bien, un espacio producto” 
interno consiste en un espacio vectorial y un producto - interno definido sobre 
dicho espacio. Así, pues, cuando V y W son espacios producto interno, se exi- 
girá de un isomorfismo de Y sobre W no solo que preserve las operaciones linea- 
les, sino que también preserve el producto interno. Un isomorfismo de un es- 
pacio producto interno sobre sí mismo se llama «operador unitario» sobre 
ese espacio. Se considerarán varios ejemplos de operadores unitarios y se esta- 
blecerán sus propiedades básicas. 


A ~ — A a — — 
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Definición. Sean V y W espacios producto interno sobre el mismo cuerpo 
y sea T una transformación lineal de V en W. Se dice que T preserva productos 
Internos si (Ta|7f) = («|B) para todo a, B de V. Un isomorfismo de V sobre W es 
un isomorfismo T de espacio vectorial de V sobre W que también preserva pro- 
ductos internos. x 


Si T preserva productos internos, entonces ||T«]| = |jæ]| y así T es necesa- 
riamente no singular. Así que un isomorfismo de V sobre W puede ser definido 
también como una transformación lineal de V sobre W que preserva productos 
internos. Si T es un isomorfismo de V sobre W, entonces T”* es un isomorfismo 
de W sobre V; luego, cuando tal T existe, se dirá simplemente que V y W son 
isomorfos. Naturalmente, el isomorfo de espacio producto interno es una re- 
lación de equivalencia. 


Teorema 10. Sean V y W espacios producto interno de dimensión finita 
sobre el mismo cuerpo y que tienen la misma dimensión. Si T es una transforma- 
ción lineal de V en W, las siguientes afirmaciones son equivalentes. 


(i) T preserva los productos internos. 

(ii) T es un isomorfismo (en un espacio producto interno). 
(iii) T aplica toda base ortonormal de V sobre una base ortonormal de W. 
(iv) T aplica cierta base ortonormal de V sobre una base ortonormal de W. 


Demostración. (i)— (ii). Si T preserva los productos internos, entonces 
||Tæ]| = llo] para todo « de V. Así, T es no singular, y como dim Y = dim W, 
se sabe que T es un isomorfismo de espacio vectorial. 

(ii) — (iii). Supóngase que T sea un isomorfismo. Sea (0%,,..., 0,) una base 
ortonormal de Y. Como T es un isomorfismo de espacio vectorial y dim W = 
dim V, se sigue que (To,, ..., Tøn} es una base de W. Como T también pre- 
serva los productos internos, (Ta,|Ta,)= (æ;lær) = Ó;,. 

(iii) — (iv). Esta no requiere comentario. 


(iv) > (i). Sea (2,, . . . , 9, y una base ortonormal de V tal que (Tx, . . . , Tan} 
sea una base ortonormal de W. Entonces j 
(Taj Tax) = (ajla) = Ôjk. 
Para cualquier « = x1% + *** + Xp%n Y B = Yii + > + Ynn de V, tenemos 


(0l) = 3 20, 
j=1 


(Tal TE) 


Il 


102] 2,Taj| z YT ar) 
3 


E E aiT a;|To) 
I 


a 

NY 
È ti; 
j=1 


y así, pues, T preserva los productos internos. |] 
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Corolario, Sean V y W espacios producto interno de dimensión finita sobre 
el mismo cuerpo. Entonces V y W son isomorfos si, y solo si, tienen la misma di- 
mensión. 


Demostración. Si {&}, a, ) es una base ortonormal de V y [B,, - . . , Bn} 
es una base ortonormal de W, sea T la transformación lineal de V en W defini- 
da por Tæ; = p;. Entonces T es un isomorfismo de V sobre W. Ẹ 


Ejemplo 22. Si V es un espacio producto interno de dimensión finita, 
entonces cada base ordenada ortonormal Bf = (%,, ..., %,) determina un 
isomorfismo de V sobre F” con el producto interno canónico. El isomorfismo 
no es más que 

T (tiar + +- + Enan) = (21, .. -p En) 


Existe el isomorfismo, aparentemente distinto, que @ determina de V sobre 

el espacio F"*! con (X|Y) = Y*X como producto interno. El isomorfismo es 
a> [ala 

es decir, la transformación que aplica « en su matriz de coordenadas en la base 

ordenada (3. Para cualquier base @, éste es un isomorfismo del espacio vec- 


torial; sin embargo, es un isomorfismo de los dos espacios con producto inter- 
no si, y solo si, es ortogonal. 


Ejemplo 23. Aqui se presenta un isomorfismo algo menos superficial. Sea 
W el espacio de todas las matrices 3 x 3, A, sobre R antisimétricas, es decir, 
A! = —A. Se dota a W del producto interno (4|B) = 3 tr (AB'): el 3 es por mera 
conveniencia. Sea V el espacio R? con el producto interno cañónico. Sea 7 una 
transformación lineal de Y en W definida por 


0 =z Le 
T(21, La, 23) = Ya 0 -zt 
—% Tı 0, 
Entonces T aplica V sobre W, y haciendo 
0 -rt á n 0 —4 Y 
A= T3 0 -zp B= Ya 0 -y 
— T tı 0 =y Y 0 


tenemos 


tr (AB^) = zys + Laya + Tys + Taye + T1 
= 2(xyı + t2 + LaYa). 


Así, pues, (a]8) = (Tæ| T$) y T es un isomorfismo de espacio vectorial. Obsér- 
vese que T aplica la base canónica (€, €,, €3) sobre la base ortonormal que consta 
de las tres matrices 


0 0 0 0.01 0 —1 0 
0 0 -ip 0 0 0p 1 0 0f 
o 1 0 -100 0 0.0 


Ejemplo 24. No siempre es particularmente conveniente describir un iso- 
imorlismo en términos de las bases ortonormales. Por ejemplo, supóngase que 
ú = P*P, donde P es una matriz n x n, inversible, con elementos complejos. 
ken V el espacio de las matrices complejas n x 1 con el producto interno 
|x| Y] = Y*GX. Sea W el mismo espacio vectorial, con el producto inter- 
no canónico (X| Y) = Y*X. Se sabe que V y W son espacios producto interno 
isomorfos. Parecería que el modo más conveniente de dar un isomorfismo 
entre F y W es el siguiente: sea T la transformación lineal de V en W definida 
por T(X) = PX. Entonces 


(TX|TY) 


(PX|PY) 
(PY)PX) 
Y*P*PX 
Y*GX 

= [X|Y]. 


Luego T es un isomorfismo. 


Ejemplo 25. Sea V el espacio de todas las funciones continuas de valor 
real en el intervalo unitario O < 1 < 1, con el producto interno 


i 1 ` 
Isio) = f; SOOP dt. 
Sca W el mismo espacio vectorial con el producto interno 


Gio = (¿$090 dt 


Sea T la transformación lineal de V en W dada por 
(TAO = fÀ. 


Entonces (Tf|Tg) = [/|g], y así T preserva los productos internos; sin em- 
bargo, T no es un isomorfismo de V sobre W, ya que la imagen de T'no es todo W. 
Por supuesto, esto sucede porque el espacio vectorial básico no es de dimen- 
sión finita. 


Teorema 11. Sean V y W espacios producto interno sobre el mismo cuerpo 
y sea T una transformación lineal de V en W. Entonces T preserva productos in- 
ternos si, v solo si, ||To|| = |la]| para todo a en V. 


Demostración. Si T preserva productos internos, entonces T «preserva 
normas». Supóngase que || 7a|| = llo] para todo a de V. Entonces |¡7a[1? = ljal}. 
Ahora. usando la identidad de polarización apropiada, (8-3) o (8-4), y el hecho 
de que T es lineal, se obtiene facilmente que (af) = (Taj Tp) para todo a, $ 
en V ] 


Definición. Un operador unitario en un espacio producto interno es un iso- 
morfismo del espacio sobre sí mismo. 


El producto de dos operadores unitarios es unitario. En efecto. si U, y U2 
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son unitarios, entonces U¿U, es inversible y ||U¿U,a|| = I1U,0]| = llall- para 
Cada a. También el inverso del operador unitario es unitario, ya que [Ual] = lla], 
dice que ||U”*fl| =||B||, donde 8 = Ua. Dado que el operador unitario es 
evidentemente unitario, se ve que el conjunto de todos los Operadores unitarios 
en un espacio producto interno es un grupo para la operación de composición. 

Si V es un espacio producto interno y U es un operador lineal sobre V, el 
Teorema 10 dice que U es unitario si, y solo si, (Ua|Uf) = («|8) para todo 
a, B de V; o si, y solo si, para cierta (toda) base ortonormal {ais - - - , On} es cierto 
que:{Ua;, ..., Uan} es una base ortonormal. 


Teorema 12. Sea U un operador lineal sobre un espacio producto inter- 
no V. Entonces U es unitario si, y solo si, el adjunto U* de U existe y UU* = 
UU = 1 

Demostración. Supóngase que U es unitario. Entonces U es inversible y 

(Ual) = (UaJUU—!8) = (aJU-18) 
para todo a, fí. Luego U`' es el adjunto de U. 
Recíprocamente, supóngase que existe U* y que UU* = U*U = I. Enton- 


ces U es inversible, con UT! = U*. De modo que solo se necesita demostrar 
que U preserva productos internos. Tenemos que 


(Ua]UB) = (aj U*UB) 
= (a|Z6) 
= (ajf) 
para todo a, f. E 


Ejemplo 26. Consideremos C”*1 con el producto interno (X| Y) = Y*X. 


Sea A una matriz n x n sobre C, y sea U el operador lineal definido por U(X) = 
.AX. Entonces 


(UX|UY) = (AX|AY) = Y*A*AX 
para todo X, Y. Luego U es unitario si, y solo si, A*A = I. 


Definición. Una matriz compleja n x n, A, se llama unitaria si A*A =I. 


Teorema 13." Sea V un espacio producto interno de dimensión finita y sea 
U un operador lineal sobre V. Entonces U es unitario si, y solo si, la matriz de U en 
alguna (o toda) base ordenada ortonormal es una matriz unitaria. 


Demostración. A esta altura, esto casi no es un teorema, y se formuló más 
que todo por insistir. Si @ = (a, ..., a,) es una base ordenada ortonormal 
de V y A es la matriz de U respecto de @, entonces A*A = Isi, y solo si, U*U =1. 
El resultado se desprende ahora del Teorema 12. I 


Sea A una matriz n x n. La afirmación de que A es unitaria solo quiere 
decir que 


; an À f hica EEE 
Espacios cot ucio interno 


(AFA) = Oye 
o e. 

Y Ar Ar = Ôr- 

rar 


En otras palabras, esto significa que las columnas de 4 forman un coping 
ortonormal de matrices columna con respecto E producto ua pes a 
(X/Y) = Y*X. Como A*A = I si, y solo si, AA = 1, vemos que e se En 
exactamente cuando las filas de A constituyen Un conjunto a, e E apl E 
de C, (con el producto interno canónico). Así, usando los pg uctos E 
canónicos, A es unitaria si, y solo si, las filas y las columnas de 4 sog e 
ortonormales. Se ve aquí un ejemplo del poder del teorema que esta ¡e bend 
una inversa latéral (a un lado) para una matriz es Inversa a abs lados. p 2 
cando este teorema como se hizo anteriormente, por ejemplo, a E 
tenemos lo siguiente: supóngase que tenemos un arreglo a pa A nime Ss 
reales tales que la suma de los cuadrados de los elementos e ela A l 2 y 3 
filas distintas son ortogonales. Entonces, lą suma de los cuadra o E e ele 
mentos de cada columna es 1 y las columnas distintas son ortogonales. Escrí- 
base la demostración de esto para un arreglo de 3 x 3 sin usar lo que se conoce 
de las matrices y se quedará bastante impresionado. 


Definición. Una matriz n x n real o compleja, A, se dice ortogonal si A'A = I 


Una matriz ortogonal real es unitaria, y una matriz unitaria es ortogonal 
si, y solo si, cada uno de sus elementos es real. 


Ejemplo 27. Damos algunos ejemplos de matrices unitarias y ortogonales. 


(a) Aes la matriz 1 x l, c, es ortogonal si, y solo si, c= +1, yes rip 
si, y solo si, ¿c = 1. La última condición quiere decir (naturalmente) que lc] =l; 
» sl, 
o c = œ, donde 0 es real. 
a b 
ae [ d 


(b) Sea 
Entonces A es ortogonal si, y solo si, 


A 1 [ d =] 
ad — be L —c a 


El determinante de una matriz ortogonal es, como fácilmente se ve, + 1. Así 
A es ortogonal si, y solo si, 
a b 
Am [ed a 


alos 
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donde a? + b? = 1. Los dos casos se distinguen por el valor de det A. 
(c) Las relaciones, bien conocidas, entre funciones trigonométricas mues- 
tran que la matriz 


cos senO 
As = 
senð cos O 
es ortogonal. Si 0 es un número real, entonces Ay es la matriz en la base orde- 
nada canónica de R? del operador lineal Uo, rotación de ángulo 0. La afirmación 
de que A, es una matriz ortogonal real (por tanto unitaria) solo quiere decir 
que Uy, es un operador unitario, es decir, preserva productos escalares. 


(d) Sea 
a b 
o [i d 


Entonces A es unitaria si, y solo si, 


Er, sen E TA, d —b 

bd ad=bcl=e a 
El determinante de una matriz unitaria tiene valor absoluto 1 y es, por tanto, 
un número complejo de la forma e”, @ real. Así A es unitaria si, y solo si, 


yr [ a b ] va E 0 [ a b 
—L-etb evil lo evll-5 a 
donde 0 es un número real, y a, b son números complejos tales que la]? + |b|?=1. 


Como se observó antes, los Operadores unitarios sobre un espacio produc- 
to interno forman un grupo. De esto y del Teorema 13 se sigue que el conjunto 
U(n) de todas las matrices unitarias n x n es también un grupo. Así la inversa 
de una matriz unitaria y el producto de dos matrices unitarias son también 
matrices unitarias. Por cierto. esto es fácil verlo directamente. Una matriz 
n x n, A, con elementos complejos es unitaria si, y solo si, 47! = A*, Así, 
si A es unitaria, tenemos que (47')71 = A = (4*) 1 = (A7 ')*. Si A y B son 
matrices unitarias n x n, entonces (AB)! = B'A! = B*4* = (ABY. 

El proceso de Gram-Schmidt en C” tiene un corolario interesante para las 
matrices en que entra el grupo U(n). 


Teorema 14. Para toda matriz compleja n x n, inversible, B, existe una úni- 
ca matriz triangular inferior M, con elementos positivos en la diagonal principal, 
de modo que MB es unitaria. 


Demostración. Las filas f,, ..., B, de B forman una base de C”. Sean 
Qis « - . , % los vectores que se obtienen de Bi, . - ., Pa por el proceso de Gram- 
Schmidt. Entonces, para 1 < k < n, {ar -.., 0%) es una base ortogonal del 
subespacio generado por Br Y 


a=b- y (Belo) 


<e llel A 


— > A 
Espacios coh pRB interno i 


Luego, para todo k, existen escalares únicos C;, tales que 
ar = pk — È Cubs. 
j<k 


Sea U la matriz unitaria con filas 


a On 
foli? Mol! 
y M la matriz definida por i 
a e sij<k 
ii =g Le , ij= 
Ilol] 
0, sij>k 


Entonces M es triangular inferior, ya que sus elementos sobre la diagonal prin- 
cipal son 0. Los elementos Mẹ de M, de la diagonal principal, son todos >0, y 


LE Mps 1<kSn. 


llall 421 


Ahora estas igualdades simplemente dicen que 
U = MB. 


Para demostrar la unicidad de M, sea T* (n) el conjunto de todas E bio 
complejas n x n triangulares, inferiores con elementos positivos e a nu 
principal. Supóngase que M, y M, sean elementos de M* (n) tales que M; 
está en U(n) para i = 1, 2. Entonces, por ser U(n) un grupo 


(MBIM2B)" = MM7” 


A R " 
está en U(n). Por otro lado, auri cuando no es enteramente obvio, T* (n) es tam 
bién un grupo para la multiplicación matricial. Un modo de vaa es consi- 
derar las propiedades geométricas de las transformaciones lineales 


X>MX, (Men T+(m) 


- -1)-1 
sobre el espacio de las matrices columnas. pa Mz 1, M,M3' e Fi 
están todas en T*(m). Pero, como MM” está en U(n), o 4z le T 
(M,M3')*. La transpuesta o la conjugada transpuesta de cua O] me 
triangular inferior es una matriz triangular superior. Por amd o 1M2 A 
simultáneamente triangular superior e inferior, es decir, moa na e 
diagonal es unitaria si. y solo si, cada uno de sus elementos de la O 
cipal tiene valor absoluto 1; si los elementos de la diagonal ple los p > 
deben ser iguales a 1. Luego M,M3* = I, con lo que M, = M,. 


Sea GL(n) el conjunto de todas las matrices complejas nxne invesible 
Entonces GL(n) es también un grupo para la multiplicación matricial. Este 
grupo. se llama el grupo lineal general. El Teorema 14 es equivalente al siguien- 
te resultado. 


E A: A cd ió 
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Corolario. Para toda B de GLAn), existen matrices úni 
l Lin), exis es únicas N y U tal 
N está en T* (n), U en U(n), y d aiai 


B=N-U. 


Demostración. Por el teorema existe una matriz única M en T*(n) tal 
que MB está en U(n). Sea MB = U y N = M`'. Entonces N está en T*(n) 
y B = N - U. Por otro lado, si se dan elementos N y U cualesquiera tales que 
N está en T* (n), U está en U(n) y B = N - U, entonces N` 'B está en U(n) y N`! 
es la única matriz M que está caracterizada por el teorema. Además U es ne- 
cesariamente N7'B. | 


pl Ejemplo 28. Sean x, y x, números reales tales quex?+x3=1yx, 20. 
ea 


a zm 0 
B=|0 1 of 
0 0 1 


Aplicando el proceso de Gram-Schmidt a las filas de B, se obtienen los vectores 


01 = (2, za, 0) 
az = (0, 1,0) — za(z,, za, 0) 
a(—za, Ti, 0) 


as = (0, 0, 1). 
Sea U la matriz con filas «1, (0,/x,), a, Entonces U es unitaria. y 
a z 0 1 0 Ola z 0 
U=l-2 a oļ=|-2 L 
2 VE 0ojj0 1 0 
0 0 1 0 0 illo O 1 
Ahora, multiplicando por la inversa de 
1050 
Mall 0 
Ti Ti 
0.0 1 


se tiene que 


a mz 0 IO. O mn t 0 


Consideremos ahora brevemente el cambio de coordenadas en un espacio 
producto interno. Supóngase que Y es un espacio producto interno de dimen- 
sión finita, y que B'= (0%, ..., n} y @' = faj, ..., an} son dos bases orde- 


O: NA A 


Espacios con producto memo 


nadas ortonormales de V. Existe una única matriz n x n (necesariamente in- 
versible), P, tal que 


[ala = Pod 


para todo a en V. Si U es el operador lineal único sobre V definido por Uaj = CA 
entonces P es la matriz de U en la base ordenada GB; 


n 
, 
ak = È Piroj. 
j=l j 


Como GB y @' son bases ortonormales, U es un operador unitario y P es una 
matriz unitaria. Si T es un operador lineal cualquiera sobre V, entonces 


[Tle = P[T]0P = P*[TlaP. 


Definición. Sean A y B matrices complejas n x n. Se dice que B es unita- 
riamente equivalente a A si existe una matriz unitarian X n, P, tal que B = P"*AP. 
Se dice que B es ortogonalmente equivalente a A si existe una matriz ortogonal 
nx n, P, tal que B = P"*AP. 


Con esta definición, lo que se observó anteriormente puede enunciarse como 
sigue: si @ y @' son dos bases ordenadas ortonormales para V, entonces, para todo 
operador lineal 7 sobre V, la matriz [7]g es unitariamente equivalente a la 
matriz [7]. En el caso que V sea un espacio producto interno real, estas ma- 
trices son ortogonalmente equivalentes a través de una matriz ortogonal real. 


Ejercicios 


1. Hallar una matriz unitaria que no sea ortogonal y encontrar una matriz ortogonal 
que no sea unitaria. 


2. Sea V el espacio de las matrices complejas n x n con producto interno (A|B) = tr (4B*). 
Para cada M en V, sea Ty el operador lineal definido por 7y(4) = MA. Demostrar que 
Tu es unitario si, y solo si, M es una matriz unitaria. 


3. Sea V el conjunto de los números complejos considerados como espacio vectorial real. 
(a) Demostrar que (a|) = Re (a $) define un producto interno sobre V. 
(b) Mostrar un isomorfismo (de espacio producto interno) de V sobre R? con el pro- 
ducto interno canónico. 


(c) Para cada y de V, sea M, el operador lineal sobre V definido por M,(a) = ya. De- 
mostrar que (M,)* = M;. 

(d) ¿Para qué números complejos y es M, autoadjunto? 

(e) ¿Para cuáles y es M, unitario? 

(£) ¿Para cuáles y es M, positivo? 

(g) ¿Cuál es det (M,)? 

(h) Hallar la matriz de M, en la base (1, i}- 

(i) Si T es un operador lineal en V, hallar condiciones necesarias y suficientes para T 
para que sea un M,. 

(j) Encontrar un operador unitario sobre V que no sea un M,- 


Dalai a i oa 


———_y> 
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. Sea V = R? con el i es un operador unitario sobre 
4. y dd producto interno canónico. Si U pe: i 
e la matri 3 OS dea? 
demostrar que la matriz de U en la base ordenada canónica es e 


cosÓ  —sen 0 ks 0  sn0 
senó  cosg sen  —cos 6. 


el operador lineal que corresponde a la primera ma- 
ngulo 0. Ahora observar que todo operador unitario 


AAN NR) ría en torno al eje <1 seguida de una rotación. 


(b) Demostrar que Uf = Us. 

(c) Sea (f un número real fijo y sea @ 
tación de (€,, €z) en el ángulo $; es decir. 
matriz de Uy en la base ordenada @? 


= (a, a) la base ortonornal obtenida por ro- 
aj = Use. Si O es otro número real. ¿cuál es la 


S S z £y con el producto interno canónico. Sea W el plano generado pora = (1.1,1) 
y P = (1, 1, —2). Sea U el operador lineal definido geométricamente como sigue: Ues la 


en la base ordenada canó- 
que æ, y æ, forman una base ortonor- 


A n que es ortogonal a W. Hallar la matri 
E a an Dd pre a g a W. Hallar la matriz de U en la 


24 y ACH j 
E pens o interno de dimensión finita y sea W un subespacio de Y. 
rl 2/4 y e any esto es, todo a de V se expresa univocamente en la forma a = f + 5% 
y y en W+, Se define un operador lineal U por Ua = fi — y. ti 
o Go TEJE que U es autoadjunto y unitario $ 
i V es R?, con el producto interno canóni 
4 i! ico, y W es el subespaci 2 
(1, 0, 1), hallar la matriz de U en la base ordenada canónica E 


7. Sea V un espacio com 
sobre V. Demostrar que 
(a) [lo + ¿Tod| = lla — ¿Tol| para todo æ en v. 
(b) a + iTa = B + iTß si, y solo si, a = f. 
(c) Z + iT es no singular. 
(d) / — iT es no singular. 
(e) Supongamos ahora que V es de dimensión finita y demostremos que 


U=(1-iD)U + iT) 


es un operador unitario; U se llama la transfe i i 
ea be o Ei 'ormación de Cayley de T. En cierto sentido 


nplejo i 
plejo con producto interno y T un operador lineal autoadjunto 


8. Si ú igui 
Si O es un número real, demostrar que las siguientes matrices son equivalentes uni- 


tariamente 
[Ss —sen 6) e ‘o 
sen cosb’ [ 0 ef 


9. Sean V un espacio producto int i i 
, erno de dimensión finita y T un operas i 

š ' d posi 
tivo sobre V. Sea pz el producto Interno sobre V definido por pla, p) Es, a U e 


Operador lineal en V y U* su adjunt 
'O con respecto a . D itari 
xon respecto al producto interno Prs, y solo si, T Aa e do 


RE, interno 


10. Sea V un espacio producto interno de dimensión finita. Para cada a, f en V, sea Ta, g 
el operador lineal en V definido por T, p(y) = Cl Pa. Demostrar que 

(a) Tg = Tha 

(b) traza (T, y) = (08). 

O Ta eT,a = Togo” 

(d) ¿En qué condiciones es 7, ¿ autoadjunto? 
1. Sca V un espacio producto interno de dimensión finita sobre el cuerpo F y sea L(V, V) 
el espacio de los operadores lineales sobre Y. Demostrar que existe un producto interno 
único sobre L(V, V) con la propiedad de que ||T, p|]? = [la][?[18I]? para todo a, f de Y 
(7, y es el operador definido en el Ejercicio 10). Hallar un isomorfismo entre L(V, V), con 
este producto interno, y el espacio de las matrices n x n sobre F, con el producto interno 
(418) = tr (48*). 
12. Sea V un espacio producto interno de dimensión finita. En el Ejercicio 6 mostramos 
cómo construir operadores lineales sobre Y que son autoadjuntos y unitarios a la vez. De- 
mostrar ahora que no hay otros, es decir, que todo operador autoadjunto y unitario surge 
de cierto subespacio W como se describió en el Ejercicio 6. 


13. Sean V y W espacios producto interno de dimensión finitá que tienen la misma di- 
mensión. Sea U un isomorfismo de Y sobre W. Demostrar que 

(a) La aplicación T— UTU”! es un isomorfismo del espacio vectorial L(V, V) sobre 
el espacio vectorial L(W, W). 

(b) traza (UTU”*) = traza (T) para todo T de L(V, V). 

(c) UT, pU *:= Tua up (Tap definido en el Ejercicio 10). 

(d) (UTU"!)* = UT*U ' 

(e) Si se dota L(V, V) del producto interno (7,|7,) = traza (7,73), y análogamente 
para L(W, W), entonces T— UTU”*' es un isomorfismo de espacios producto interno. 
14. Si V es un espacio producto interno, un movimiento rígido es cierta función T de V en 
V (no necesariamente lineal) tal que ||Ta — TPl| = ||x — fl| para todo a, f de V. Ejemplo 
de movimiento rígido es un operador lineal unitario. Otro ejemplo es la traslación de vec- 
tor dado y: 

Tyla) =a + Y 
(a) Sea Y — R?, con el producto interno canónico. Supóngase que T es un movimiento 


rígido de V y que T(0) = 0. Demostrar que T es operador lineal y unitario. 

(b) Usar el resultado de la parte (a) para demostrar que todo movimiento rígido de 
R? está compuesto de una traslación, seguida de un operador unitario. 

(c) Demostrar ahora que un movimiento rígido de R? es una traslación seguida de 
una rotación, o una traslación seguida de una simetría seguida de una rotación, 


15. Un operador unitario sobre R* (dotado del producto interno canónico) es simplemen- 
te un operador lineal que preserva la forma cuadrática, 


lIGe, y, 2, D|]? = z? + y? + z2? + t 


esto es, un operador lineal U tal que ||Ua]|? = ||a||? para todo a de R*. En cierta parte de 
la teoría de la relatividad es de interés hallar los operadores lineales T que preservan la 


forma 
ll, y, 2 Dilz = P — z? — y? — z. 


Pero aquí || ||} no proviene de un producto interno, sino de algo llamado la «métrica de 
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Lorentz» (en la que no entraremos). Por esa razón un operador lineal T sobre R* tal que 
[[Tall2 = ljal}, para todo a de R*, se llama transformación de Lorentz. 
(a) Demostrar que la función U definida por 


U(x, y, 2,1) = e is 


es un isomorfismo de R* sobre el espacio vectorial real H de las matrices complejas 2 x 2 
autoadjuntas. 

(b) Demostrar que llællē = det (Ux). 

(c) Supóngase que 7 es un operador lineal (real) sobre el espacio H de las matrices 
2 x 2 autoadjuntas. Demostrar que L = U”*TU es un operador lineal sobre R4. 

(d) Sea M una matriz compleja 2 x 2 cualquiera. Mostrar que Ty (4) = M*AM de- 
fine un operador lineal Tọ sobre H (asegurarse de que 7,, aplica H en H). 

(e) Si M es una matriz 2 x 2 tal que [det M| = 1, demostrar que Ly = U”'TyU es 
una transformación de Lorentz en R*. 

(f£) Hallar una transformación de Lorentz que no sea un Ly- 


8.5. Operadores normales 


El objetivo principal de esta sección es la solución del siguiente problema. 
Si T es un operador lineal sobre un espacio producto interno de dimensión 
finita V, ¿en qué condiciones tiene V una base ortonormal formada por vec- 
tores propios de T? En otras palabras, ¿cuándo existe una base ortonormal @ 
de V, tal que la matriz de T en la base @ sea diagonal? 

Comenzaremos deduciendo unas condiciones necesarias para T, que más 
adelante se verá que son suficientes. Supongamos que @ = (,, ..., On} es 
una base ortonormal de V con la propiedad 


(8-16) Taj = Cjaj, di ys 


Esto solo dice que la matriz de T en la base ordenada @ es la matriz diagonal 
con elementos C,, ..., €, en la diagonal. El operador adjunto T* está repre- 
sentado en esta misma base ordenada por la matriz transpuesta conjugada; 
es decir, la matriz diagonal con elementos €,, ..., €, en la diagonal. Si V es un 
espacio producto interno real, los escalares c}, ..., €, son (claro está) reales 
y, por tanto, debe tenerse que T = T*. En otras palabras, si V es un espacio 
producto interno real de dimensión finita y T es un operador lineal para el que 
existe una base ortonormal de vectores propios, entonces T debe ser autoadjunto. 
Si V es un espacio producto interno complejo, los escalares c4, ..., €, NO ne- 
cesitan ser reales; es decir, T no necesita ser autoadjunto. Pero obsérvese que 
T debe satisfacer 


(8-17) TT* = TT. 


En efecto, dos matrices diagonales cualesquiera conmutan, y como T y T* 
están ambos representados por matrices diagonales en la base ordenada BR. 
se tiene (8-17). Es más bien notable que, en el caso complejo. esta condición 
sea también suficiente para implicar la existencia de una base ortonormal de 
vectores propios. 


Definición. Sean V un espacio producto interno de dimensión finita y T un 
eperador lineal sobre V. Se dice que T es mormal si conmuta con su adjunto; es 
decir, TT* = T*T 


Todo operador autoadjunto es normal, como también todo operador uni- 
tario; sin embargo, las sumas y productos de operadores normales no son en 
general normales. Aunque no es necesario, comenzaremos el estudio de los 
operadores normales considerando operadores autoadjuntos. 


Teorema 15. Sean V un espacio producto interno y T un operador lineal 
uutoadjunto sobre V. Entonces todo valor propio de T es real y los vectores propios 
de T, asociados a valores propios distintos, son ortogonales. 


Demostración. Supóngase que c es un valor propio de T; es decir, que 
Tx = co para algún vector no nulo a. Entonces 
clala) = (cala) 
= (Tala) 
= (aļTa) 
= (aļca) 
= tlala). 
Como (aa) + 0, debemos tener que ¢ = Z. Supóngase que también tenemos 
que Tf = dh con f + 0. Entonces 


c(a/8) = (Talp) 
= (0/76) 
= (alde) 
= d(aļf) 
= d(alp). 


Si c + d, entonces (a|f$) = 0. E 


Debe observarse que el Teorema 15 no dice nada respecto a la existencia 
de valores propios o de vectores propios. 


Teorema 16. En un espacio producto interno de dimensión finita y positi- 
va todo operador autoudjunto tiene un vector propio (no nulo). 


Demostración. Sea Y un espacio producto interno de dimensión n, donde 
n > 0, y sea T un operador autoadjunto en V. Se elige una base ortonormal 
@ para V y sea A = [T]g. Como T = T*, tenemos que A = A*. Ahora sea 
W el espacio de las matrices n x 1 sobre C, con el producto interno (Y | PHa 
Y*X. Entonces U(X) = AX define un operador lineal autoadjunto U en W. 
El polinomio característico, det (x7 — 4), es un polinomio de grado n sobre 
los números complejos; todo polinomio sobre C de grado positivo tiene una 
raíz. Así existe un número complejo c tal que det (c7 — 4) =. 0. Esto quiere 
decir que A — cl es singular, o que existe un X distinto de cero tal que AX = cX. 
Como el operador U (multiplicación por A) es autoadjunto, se sigue del Teo- 
rema 15 que c es real. Si V es un espacio vectorial real, se puede elegir X de modo 
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que tenga elementos reales. En efecto, entonces A y A — cl tienen elementos 
reales y como A — cl es singular, el sistema (A — cI)X = 0 tiene solución 
real X no nula. Se sigue que existe un vector a, no nulo, en V tal que Ta = ca. I 


Varios comentarios se pueden hacer respecto a la demostración. 

(1) La demostración de la existencia de una X no nula tal que AX = c¥ 
no tiene nada que ver con el hecho de que A fuese hermítica (autoadjunta). 
Ello muestra que cualquier operador lineal sobre un espacio vectorial comple- 
jo de dimensión finita tiene un vector propio. En el caso de un espacio producto 
interno real, el ser 4 autoadjunta se usa fundamentalmente para ver que cada 
valor propio de A es real y luego que se puede hallar una X apropiada con ele- 
mentos reales. 

(2) El razonamiento muestra que el polinomio característico de una matriz 
autoadjunta tiene coeficientes reales a pesar de que la matriz puede no tener 
elementos reales. 

(3) La suposición de que V es de dimensión finita es necesaria para el teore- 
ma; un operador autoadjunto en un espacio producto interno de dimen- 
sión infinita puede no tener un valor propio. 


Ejemplo 29. Sea V el espacio vectorial de las funciones continuas de valor 
complejo (o real) en el intervalo unitario, 0 < £ < 1, con el producto interno 


uo = [1070 a. 


El operador «multiplicación por t», (TfXt) = tf(t), es autoadjunto. Supon- 
gamos que Tf = cf. Entonces 


-9f =0,  0<t<1 


y así f(t) = 0 para t + c. Como f es continuo, f = 0. Luego T tiene valores 
(vectores) propios. 


Teorema 17 Sea V un espacio producto interno de dimensión finita y sea 
T un operador lineal sobre V. Supóngase que W es un subespacio de V que es in- 
variante por T. Entonces el complemento ortogonal de W es invariante por T*. 


Demostración. Recuérdese que el que W sea invariante por T no quiere 
decir que todo vector de W quede fijo por T; quiere decir que si œ está en W 
entonces Ta está en W. Sea f en W+. Debemos mostrar que T*f está en WŁ, 
esto es, que (a| T*ß) = 0 para todo a en W. Si a está en W, entonces Ta está 
en W, de modo que (Ta|f) = 0. Pero (Taj) = (a|T*B). E 


Teorema 18. Sea V un espacio producto interno de dimensión finita y sea 
T un operador lineal autoadjunto sobre V. Entonces existe una base ortonormal 
de V en la que cada vector es un vector propio de T. 


Demostración. Se supone que dim V > 0. Por el Teorema 16, T tiene un 
vector propio a. Sea a, = a/lla]] de modo que a, es también un vector propio 
para T y llu,|| = 1. Si dim V = 1, se habrá concluido con la demostración. 
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Se procede ahora por inducción sobre la dimensión de V. Supóngase que el 
leorema es válido para espacios producto interno de dimensión menor que 
dim V. Sea W el espacio unidimensional generado por el vector œ. La afir- 
mación de que a, es un vector propio para T quiere decir simplemente que W es 
invariante por T. Por el Teorema 17, el complemento ortogonal W+ es inva- 
nante por 7* = T. Ahora W, con el producto interno de V, es un espacio pro- 
ducto interno de dimensión menor en uno que la dimensión de W. Sea U el 
operador lineal inducido en W+ por T, esto es, la restricción de Ta W+. Enton- 
ces U es autoadjunto y, por la hipótesis inductiva, W tiene una base ortonormal 
|, - -., On} que consiste en vectores propios de U. Ahora cada uno de estos 
vectores es también un vector propio de T, y como V = W @ WŁ, conclui- 
mos que (a,, ..., 0,) es la deseada base para V. Ẹ 


Corolario. Sea A la matriz n x n hermítica (autoadjunta). Entonces existe 
una matriz unitaria P tal que P7*AP es diagonal (A es unitariamente equivalente 
a una matriz diagonal). Si A es una matriz simétrica real, hay una matriz ortogo- 
nal real P tal que P7*AP es diagonal. 


Demostración. Sea VW=C"**, con el producto interno canónico, y sea T el 
operador lineal sobre V representado por A en la base ordenada canónica. 
Como A = A*, tenemos que T = T*. Sea @ = (%,, ..., a) una base orde- 
nada ortonormal de V, tal que Ta; = cja; ¡=1,..., n. Si D=[T]g, en- 
tonces D es la matriz diagonal con elementos c,, ..., C, en esa diagonal. Sea 
P la matriz con vectores columna 0,, ..., 0%,. Entonces D = P"*AP. 

En el caso de que cada elemento de A sea real, se puede tomar Y como R”, 
con el producto interno canónico, y se repite el razonamiento. En este caso 
P será una matriz unitaria con elementos reales, es decir, una matriz ortogo- 
nal real. f 


Combinando el Teorema 18 con los comentarios que hicimos al comienzo 
de esta sección, se tiene lo siguiente: si V es un espacio producto interno real de 
dimensión finita y T es un operador lineal sobre V, entonces V tiene una base 
ortonormal de vectores propios para T si, y solo si, T es autoadjunto. A esto 
equivale decir: si A es una matriz n x n con elementos reales, existe una matriz 
ortogonal real P tal que P'AP es diagonal si, y solo si, A = A". No existe un 
resultado semejante para matrices simétricas complejas. En otras palabras, para 
matrices complejas hay una diferencia significativa entre las condiciones A = 
A y A= A*. 

Habiendo visto el caso de los autoadjuntos, volvemos ahora al estudio de 
los operadores normales en general. Se demostrará el análogo al Teorema 18, 
para operadores normales, en el caso complejo. Hay una razón para esta res- 
tricción. Un operador normal sobre un espacio producto interno real puede 
no tener un vector propio no nulo. Esto es cierto, por ejemplo, para todas las 
rotaciones en R?, a excepción de dos. 


Teorema 19. Sean V un espacio producto interno de dimensión finita y T un 
operador normal sobre V. Supóngase que a es un vector de V. Entonces a es un 
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vector propio de T con valor propio c si, y solo si, a es un vector propio para TE 
con valor propio C. 


Demostración. Supóngase que U sea un operador normal en V. Entonces 
||Ua]| = ||U*a]|. En efecto, usando la condición de que UU* = U*U se tiene que 


[|Ua]|? = (UalUa) = (a[U*Ua) 
= (aJUU*a) = (U*qU*a) = ||U*a]|?. 


Si c es un escalar cualquiera, el operador U = T — cI es normal. En efecto, 
(T — cI)* = T* — él, con lo que es fácil de verificar que UU* = U*U. Así, 


IICT — Dall = |1(7* — Dall 
de modo que (T — cI) = 0 si, y solo si, (T* — ¿Na = 0. I 


Definición. Una matriz compleja n x n, A, se llama normal si A4* = A*A. 


No es mùy fácil entender lo que significa normal en matrices u operado- 
res; sin embargo, con objeto de desarrollar un sentido para tal concepto, el 
lector podria encontrar de utilidad saber que una matriz triangular es normal 
si, y solo si, es diagonal. 


Teorema 20. Sean V un espacio producto interno de dimensión finita, T un 
operador lineal sobre V y @ una base ortanormal de V. Supóngase que la matriz 
A de T en la base GB es triangular superior. Entonces T es normal si, y solo si, A 
es una matriz diagonal. 


Demostración. Como G es una base ortogonal, A* es la matriz de T* en @. 
Si A es diagonal, entonces A4* = A*A, y esto implica que TT* = T*T. Reci- 
procamente, supóngase que T sea normal y sea @ = (a,, ..., %,). Entonces, 
como Á es triangular superior, Ta, = A,1%,. Por el Teorema 19 esto implica 
que T*a, = A,10,. Por otro lado 


Por tanto, A,; = 0, para todo j > 1. En particular A,, = 0, y como A es trian- 
gular superior, se sigue que 


Tas = Åna. 


Así, T*a, = Ā,202 y Az; = 0 para todo j + 0. Continuando de esta manera 
se llega a demostrar que A es diagonal. f 


Teorema 21. Sea V un espacio producto interno de dimensión finita y sea 
T un operador lineal sobre V. Entonces existe una base ortonormal de V en la 
que la matriz de T es triangular superior. 
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Demostración, Sea n la dimensión de V. El teorema es cierto cuando n= 1, 
y se procede por inducción en n, suponiendo que el resultado es cierto para 


operadores lincales en espacios producto interno complejos de dimensión 


n — 1. Como V es un espacio producto interno de dimensión finita, hay un 
vector unitario a en V y un escalar c tales que 


T*a = ca. 
Sea W el complemento ortogonal del subespacio generado por a y sea S la res- 
tricción de Ta W. Por el Teorema 17, W es invariante por T. Así que S es un ope- 
rador lineal sobre W. Como W tiene dimensión n — 1, la hipótesis inductiva 
implica la existencia de una base ortonormal [a,, ..., %,-,) de W en la cual 


la matriz S es triangular superior; sea o, = æ. Entonces (%,, ..., %,) es una 
hise ortonormal de V en la que la matriz de T es triangular superior. Ẹ 


Este teorema implica el siguiente resultado para las matrices. 


Corolario. Para toda matriz compleja n x n, A, existe una matriz unitaria 
U tal que U7* AU es triangular superior. 


Ahora, combinando el Teorema 21 con el Teorema 20, se tiene, sin más, 
el siguiente análogo al Teorema 18 para operadores normales. 


Teorema 22. Sean V un espacio producto interno complejo de dimensión 
finita y T un operador normal sobre V. Entonces V tiene una base ortonormal 
que consiste en vectores propios de T. 


También existe una interpretación matricial. 


Corolario. Para toda matriz normal A existe una matriz unitaria P tal que 
P'AP es una matriz diagonal. 


Ejercicios 


t. Para cada una de las siguientes matrices simétricas reales. A, hallar una matriz orto- 


konal real P tal que P'AP sea diagonal. 


1 A 1 Al cos O sen 0 
Talii 2 ik sen (O —cos 0 


2. ¿Es una matriz simétrica compleja autoadjunta? ¿Es normal? 


123 
A=|2 3 4 
3.4 5 


3. Para 
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hay una matriz ortogonal real P tal que P~'AP = D sea diagonal. Hallar tal matriz dia- 
gonal D. 


4. Sea V = C?, con el producto interno canónico. Sea T el operador lineal sobre V re- 
presentado en la base canónica por la matriz 


NE: 
a=[; i} 
Demostrar que T es normal y hallar una base ortogonal de Y que consista en vectores pro- 
pios de T. 


5. Dar un ejemplo de una matriz 2 x 2, A, tal que A? sea normal, pero que A no lo sea. 


6. Sea T un operador normal sobre un espacio producto interno complejo de dimensión 
finita. Demostrar que T es autoadjunto, positivo, o unitario según que todos los valores 
propios de T scan reales, positivos o de valor absoluto igual a 1. (Usar el Teorema 22 para 
reducir el problema a uno similar respecto a matrices diagonales.) 


7. Sea T un operador lineal sobre el espacio producto interno de dimensión finita V y 
supóngase que T es positivo y unitario. Demostrar que T=f 


8. Demostrar que T es normal si, y solo si, T = T, + ¿T,, donde 7, y T, son operado- 
res autoadjuntos que conmutan. 

9. Demostrar que una matriz simétrica real tiene una raíz cúbica simétrica; es decir, si 
A es simétrica real, existe una simétrica real B tal que B? = A 

10. Demostrar que toda matriz positiva es cuadrado de una matriz positiva. 

11. Demostrar que un operador normal y nilpotente es el operador cero. 


12. Si T es un operador ngrmal, demostrar que los vectores propios de T, asociados a 
distintos valores propios, son ortogonales. x 


13. Sea T un operador normal sobre un espacio producto interno complejo de dimensión 
finita. Demostrar que existe un polinomio f, con coeficientes complejos, tal que 7* = f(T). 
(Representar T por medio de una matriz diagonal y ver qué debe ser SA) 


14. Si dos operadores normales conmutan, demostrar que su producto es normal. 


9. Operadores sobre espacios 
producto interno 


9.1. Introducción 


La mayoría de los temas del Capítulo 8 se consideran fundamentales. Es 
la materia que todos deben saber. El presente capítulo es para estudiantes más 
avanzados o para el lector deseoso de ampliar sus conocimientos acerca de 
operadores sobré espacios producto interno. Con la excepción del teorema 
del eje principal, que esencialmente no es más que otra formulación del Teore- 
ma 18 sobre la diagonalización ortogonal de operadores autoadjuntos, y los 
otros resultados sobre formas de la Sección 9.2, el material que aquí se pre- 
senta es más complicado y generalmente implica mayor tecnicismo. También 
exigimos más del lector, como se hizo en la parte final de los Capítulos 5y7. 
Los razonamientos y demostraciones están escritos en estilo más condensado 
y no se dan casi ejemplos para facilitar el camino; sin embargo, hemos pro- 
curado que el lector disponga de abundantes conjuntos de ejercicios. 

Las tres primeras secciones se dedican a los resultados concernientes a for- 
mas en espacios producto interno y a la relación entre formas y operadores 
lineales. La siguiente sección se ocupa de la teoría espectral, es decir, de las 
consecuencias de los Teoremas 18 y 22 del Capítulo 8 en lo que se refiere a la 
diagonalización de operadores autoadjuntos y mormales. En la sección final 
proseguimos el estudio de los operadores normales tratando en particular el 
caso real; al hacerlo se examina lo que dice el teorema de descomposición prima 
del Capítulo 6 respecto a los operadores normales. 
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9.2. Formas sobre espacios producto interno 


Si T es un operador lineal sobre un espacio producto interno de dimensión 
finita V, la función f definida sobre Y x V por 


Fla, B) = (Talp) 


puede considerarse como un tipo de sustituto para T. Muchas cuestiones res- 
pecto de T equivalentes a cuestiones respecto de f. En efecto, es fácil ver que 
f determina a T. Pues si @ = (a, ..., a) es una base ortonormal de V, en- 
tonces los elementos de la matriz de T en @ vienen dados por 


An = flor, a). 


Es importante entender por qué f determina a T desde un punto de vista más 
abstracto. Las propiedades características de f están descritas en la siguiente 
definición. 


Definición. Una forma (sesquilineal) sobre un espacio vectorial real o com- 
plejo V es una función f sobre V x V con valores en el cuerpo de los escalares 
tal que » 


(a) Sicat By) = fla, 1) + Mb, y) 
(b) flo, ch + 1) =¿fío, B) + fía. y) 


para todo a, f, y de V y todos los escalares c. 


Así, una forma sesquilineal es una función sobre V x V tal que fía, £) 
es una función lineal de a para £ fijo y una función lineal-conjugada de ff para 
o fijo. En el caso real, f(a, p) es una función lineal de cada argumento; o sea 
que f cs una forma bilineal. En el caso complejo, la forma sesquilineal f no 
es bilincal, a menos que f = 0. En el resto de este capítulo se omitirá el adjetivo 
«sesquilineal», salvo que sea importante tenerlo en cuenta. 

Si f y g son formas sobre V y c es un escalar, es fácil probar que cf + g es 
también una forma. De esto se concluye que toda combinación lineal de formas 
sobre V es a su vez una forma. Así, el conjunto de todas las formas sobre Y 
es un subespacio del espacio vectorial de las funciones escalares sobre V x V. 


Teorema 1. Sean V un espacio producto interno de dimensión finita y f 
una forma sobre V. Entonces existe un operador lineal único sobre V tal que 


Fo, B) = (To]B) 


para cualesquiera a, p de V, y la aplicación f — T es un isomorfismo del espacio 
de las formas sobre L(V, V). 


Demostración. Fijado el vector f en V, entonces a —> fía, p) es una fun- 
ción lineal sobre V. Por el Teorema 6 existe un vector único f' de F tal que 
Ja, P) = (a]f”) para todo a. Se define una función U de V en V haciendo UB=8". 
Entonces 


cto interno 


= (aJU(cB + y) 
= la, P) + Fla, Y) 

= (a Uf) + (oJUy) 

= (elcUB + Uy) 

ara cualesquiera a, f, y en V y todos los escalares c. Así, U es un operador 
lincal ai V, y Ai ye es un operador tal que fla, $) = (To|fB) para todo 
x y B. Si tenemos también que fa, p) = (T'x|B), entonces 


(Ta — T'al8) = 0 


para todo a y ff; con lo que Ta = T'a para todo a. Así, para cada forma f existe 
un único operador lineal 7, tal que 


Fa, B) = (Tral6) 
para todo a, $ de V. Si f y g son formas y c un escalar, entonces 
($ + Dl, B) = (Terral) 
día, p) + gla, B) 


c(Tyal8) + (Talb) 
= ((cT, + To)alb) 


flalc + y) 


ll 


para todo a y f de V. Por tanto, 
Teso = CT¡ + Te 

y f— T; es una aplicación lineal. Para todo T en L(V, V) la ecuación 
Fa, B) = (Tag) 


define una forma tal que Tp = T, y T; = 0 si, y solo si, f = 0. Asi, f — Tp es 
un isomorfismo. f 


Corolario. La ecuación 
Ulea) = tr (T TR) 
define un producto interno sobre el espacio de las formas con la propiedad de que 
dlg) = X fls ae laz, aj) 
d, 
para toda base ortonormal ([Q,, ..., Ony. de V. 


Demostración. Se sigue fácilmente del Ejemplo 3 del Capítulo 8 que (T, U> 
tr (TU*) es un producto interno sobre L(V, V). Como f— T; es un isomor- 
fismo, el Ejemplo 6 del Capítulo 8 muestra que 


Glo) = tr (1,T;) 


es un producto interno. Supongamos ahora que A y B son las matrices de T, y 
T, en la base ortonormal @ = fæ}, ..., æn}. Entonces 


An = (Tjærla;) + Jas, aj) 
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y Bn =(T¿0x]0,) = g(x, &;). Como AB* es la matriz de T,Fí en la base @, 
se sigue que i i 


Ulg) = tr (4B*) = E AaB: M 
J 


Definición. Si f és una forma y @ = (a,, ..., ap} una base ordenada ar- 
bitraria de V, lá matriz A de elementos j See 
/ Ay = flo, 4) 
se llama matriz de f en la base ordenada G. 
Cuando GB es una base ortonormal; la matriz de f en G es también la matriz 


de la transformación lineal 7, pero en general éste no es el caso. 
Si A es la matriz de f en la base ordenada @ = (a,, ..., a,),.se sigue que 


. (9-1) 12 TA D Yra) = E Y, Arta 
r ra 
para todos los escalares x, é y, (1 < r, s < n). O sea que la matriz A tiene la 
propiedad de que 
$0, B) = Y*AX 
. donde X e Y son las respectivas matrices de coordenadas de a 
n e ra o adas de a y J.en la base 
La matriz de f en otra base . 
a = X Pija (1 <j<n) 


está dada por la ecuación Eh 
(9-2) A' = P*AP. 
En efecto, 
Ar = flak, a) 
=f z E. WA z Par) 


=D PA Par 
= (PAP) y. 


Como para las matrices unitarias es P* = P71, se sigue: de (9-2) que los 
resultados que conciernen a la equivalencia unitaria pueden aplicarse al estu- 
dio de las formas. 


ds Teorema 2. Sea f una forma en un espacio producto interno complejo de 
limensión finita. Entonces existe una base ortonormal de V en la que la matriz 
de f es triangular superior. 


Demostración. Sea T el operador lineal sobre V tal = 

que f(a, P) = (Ta|B) 
para todo a y b. Por el Teorema 21, existe una base ortonormal [a,, ..., i! } 
en que la matriz de T es triangular superior. Luego, i 
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Flor aj) = (Taxlas) = 0 
sSj>k. i 


Definición. Una forma f sobre un espacio vectorial real, o complejo, V se 


llama hermitica si 
fœ, B) = FB, a) 
pura todo a y ß en V. 


Si T es un operador lineal sobre un espacio producto interno de dimensión 
finita V y f es la forma 


fla, 6) = (Talp) 


entonces JB, a) = (a| Tp) = (T*a|P); asi que, f es hermítica si, y solo si, 7 es 
autoadjunto. 

Cuando f es hermítica, f(u, a) es real para todo a, y en los espacios com- 
plejos esta propiedad caracteriza a las formas hermíticas. 


Teorema 3. Sean V un espacio vectorial complejo y f una forma sobre V 
tal que fla, a) sea real para todo a. Entonces f es hermitica. 

Demostración. Sean a y ß vectores de V. Se debe demostrar que fa, p) = 
FP, œ). En efecto, 


Fla +B, a +8) = f(a, B) + Sa, B) + fB, a) + FB, B). 


Como fla + p, a + B), fa, a) y AB. B) son reales, el número fla, B) + A(B, a) 
es real. Por el mismo razonamiento, con a + iß en vez de a + p, vemos que 
—ifío, B) + f(B, a) es real. Habiendo concluido que esos dos números son 
reales, se les hace iguales a sus complejos conjugados y obtenemos 


Sa, B) +$(8, a) = Fla, B) + $(, a) 
—if(a, B) + if(B, a) = ifla, B) — if(6, a) 


Si multiplicamos la segunda ecuación por i y se suma a la primera ecuación, 
tenemos 


fla, 2) = (6,0). E 


Corolario. Sea T un operador lineal sobre un espacio producto interno com- 
plejo de dimensión finita. Entonces T es autoadjunto si, y solo si, (Tajo) es real 
para todo a de V. 


Teorema 4 (teorema del eje principal). Para toda forma hermitica f en un 
espacio producto interno de dimensión finita V, existe una base ortonormal de 
V en la que f está representada por una matriz diagonal con elementos reales. 

Demostración. Sea T el operador lineal tal que fía, $) = (Ta|f) para todo 
a y B de V. Entonces, como fla, p) = JØ, 2) y (TB, a) = («| Tf), se sigue que 


(Talp) = JB, a) = (a| Tp) 


para todo a y f; luego T= T*. Por el Teorema 18 del Capítulo 8, existe una 
base ortonormal de V formada por los vectores característicos para T. Supón- 


gase que (0%,, ..., æn} es una base ortonormal y que 


a Taj = cja; 
para 1 < j < n. Entonces 4 E 


lar as) = (Tarla) = ôkjck 
y por el Teorema 15 del Capítulo 8, todo c, es real. Pp 


Corolario. En las condiciones anteriores 


[2 xia Z yro) = È cxi 
J 3 


Ejercicios 


1. ¿Cuáles de las siguientes funciones f definidas para los vectores a = (xı, x,) y 
B = (Yı; y2) de C? son formas (sesquilineales) sobre C2? 


(a) fla, p) = 1. 

(b) f(a, B) = (a — 7)? + 24 

(c) Sla, B) = (21 + 7)? — (21 — Y)? 
(d) fa, 6) = xi — Ëy 


2. Sca f la forma sobre R? definida por 


Fa, N), (22, Y2)) = TN + Tyo 


Hallar la matriz de f en cada una de las siguientes bases: 


((1,0), (0, D}, (1, =D), (1, D}, (1, 2), (3, 9}. 


17 
A= a 
—i sJ 
y sea g la forma (en el espacio de las matrices complejas 2 x 1) definida por g(X, Y) = 
Y*AX. ¿Es g un producto interior? 


4. Sea V un espacio vectorial complejo y sea f una forma (sesquilineal) simétrica sobre V: 


Sa, p) = FB. a). ¿Qué es f? 
5. Sca f la forma sobre R? dada por 
Fx, 22), (Ya Y)) = 0 + Aaa + Laya + 2r). 
Hallar una base ordenada en la que f esté representada por una matriz diagonal. 


6. La forma f se llama no degenerada (a la izquierda) si O es el único vector a tal que 
fa. P) = 0 para todo £. Sea f una forma sobre un espacio producto interno V. Demostrar 
que f es no degenerada si. y solo si, el operador lineal asociado 7, (Teorema 1) es no singular. 


de Sea f una forma en un espacio vectorial de dimensión finita V. Se hace referencia a 
la definición de la no degeneración a la izquierda dada en el Ejercicio 6. Definir la no de- 
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generación a la derecha y demostrar que la forma f es no degenerada a la izquierda si, y solo 
si, es no degenerada a la derecha. 


8. Sea f una forma no degenerada (Ejercicios 6 y 7) en un espacio V de dimensión finita. 
Sea Z un funcional lineal sobre V. Demostrar que existe un vector f, y solo uno. en V tal 
que L(a) = fía, B) para todo a. 

Y. Sea f una forma no degenerada en un espacio V de dimensión finita. Mostrar que cada 
operador lineal S tiene un «adjunto respecto de f». es decir, un operador S’ tal que 
Sx, B) = fa, S'P) para todo a, p. 


9.3. Formas positivas 


En esta sección se examinarán formas (sesquilineales) no negativas y sus 
relaciones con un producto interno dado sobre el espacio vectorial principal. 


Definiciones. Una forma f en un espacio vectorial real o complejo V es no 
negativa si es hermitica y fla, a) > O para todo a. en V. La forma f es positiva 
si f es hermitica y fía, a) > 0 para todo a + 0. 


Una forma positiva en V es simplemente un producto interno sobre V. Una 
forma no negativa satisface todas las propiedades de un producto interno, 
con la excepción de que hay vectores no nulos que pueden ser «ortogonales» 
consigo mismos. 

Sea f una forma en un espacio Y de dimensión finita. Sea @ = (01, . . ., On} 
una base ordenada de V y sea A la matriz de f en la base G, esto es, Ajy = f(0y, 0). 
Sia =x/01 +: + Xp, entonces 


fla, a) = fÈ Tja 2 104) 
E 
= 22 Tif laj, ox) 


= EX Art jir 
j k 
` 

Así, pues, se ve que f es no negativa si, y solo si, 

A =A* 
y 
(9-3) EE Ayjx¡X, > 0 para todos los escalares Xy, ..., Xn- 

FS 


Para que f sea positiva, la desigualdad (9-3) debe ser estricta para todo 
(X1 - - -> Xp) + 0. Las condiciones deducidas dicen que f es una forma positiva 
en V si, y solo si, la función 


g(X, Y) = Y*AX 


es una forma positiva en el espacio de las matrices columnas sobre el cuerpo 
escalar. 
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Teorema 5. Sea F el cuerpo de los números reales o el cuerpo de los nú- 
meros complejos. Sea A una matriz n x n sobre F. La función g definida por 


(9-4) g(X, Y) = Y*4x 


es una forma positiva en el espacio F"** si, y solo si, existe una matriz inversi- 
ble P, con elementos en F, tal que A = P*P. 


Demostración. Para cualquier matriz n x n, A, la función g de (9-4) es 
una forma en el espacio de las matrices columnas. Se demostrará que g es po- 
sitiva si, y solo si, A = P*P. Primeramente, supóngase que A = P*P. Enton- 
ces g es hermítica y 

g(X, X) = X*P*PX 
= (PX)*PX 
> 0. 


Si P es inversible y X + 0, entonces (PX)*PX > 0. Ahora supóngase que g 
es una forma positiva en el espacio de las matrices columnas. Entonces es un 
producto interno y, por tanto, existen matrices columnas Q y, ..., Q, tales que 


85 = 9(Q,, Qu) 
krd QŁAQ;. 
Pero esto dice, justamente, que si Q es la matriz con columnas Q,, ..., Qn 
entonces Q*4Q = I. Como {Q;, ..., Qn} es una base, Q es inversible. Con 
P=Q"! se tiene A = P*P. | 


En la práctica no es tan fácil verificar si una matriz dada, A, satisface el 
criterio de positividad que se ha dado hasta ahora. Una consecuencia del último 
teorema es que si g es positiva, entonces det A > 0, ya que det A = det (P*P) = 
det P* det P = [det P|?. El que det A > 0 no quiere decir que sea suficiente 
para garantizar que g es positiva; sin embargo, hay n determinantes asociados: 
con A que tienen esta propiedad: si A = A* y si cada uno de estos determinantes 
es positivo, entonces g es una forma positiva. 


Definición. Sea A una matriz n x n sobre el cuerpo F. Los menores principales 
de A son los escalares AA) definidos por 


Ain .-- Aik 
AJA) = det | : cai ES 1<k<n. 
Ar --- Ark 


Lema. Sea A una matriz inversible n x n con elementos en un cuerpo F. 
Las dos afirmaciones siguientes son equivalentes. 


(a) Existe una matriz triangular superior P con Py = 1 (1 < k < n) tal 
que la matriz B = AP es triangular inferior. 


(b) Los menores principales de A son todos distintos de 0. 


Demostración. Sea P cualquier matriz n x n y hágase B = AP. Entonces 
Ba = È APh. 


Si P es triangular superior y Pi, = 1 para todo k, entonces 


k-1 

2 AP. = Bir — Ar, k> L 

= 
Ahora bien, B es triangular inferior siempre que B = 0 para j < k. Así, pues, 
B será triangular inferior si, y solo si, 


k-1 
(9-5) Y AjPr = —Amy  1Sj<k-—1 
Aa 2<k<n. 


Con lo que vemos que la afirmación (a) del lema es equivalente a la afirmación 
de que existen escalares P, 1 <r <k, 1<kx<n, que satisfacen (9-5) y 
Py =l, 1<k<n. 

En (9-5), para todo k > 1 tenemos un sistema de k — 1 ecuaciones lineales 
para las incógnitas Py, Pax, . . . , Ph-1,x- La matriz de coeficientes de ese sis- 
tema es 

An E e Aria 


Ara en Abal 


y su determinante es el menor principal A,- ,(4). Si cada A,- (4) + 0, el sis- 
tema (9-5) tiene soluciones únicas. Hemos demostrado que la afirmación (b) 
implica la afirmación (a) y que la matriz P es única. 
Ahora supóngase que se verifica (a). Entonces, como se verá, 
ALA) = A(B) 
= BuBn -++ Bu, k=1...,2n 


Para verificar (9-6), sean A,, ..., An y Bi, - - -, B, las columnas de A y B, res- 
pectivamente. Entonces 


Bı = A, 


(9-6) 


9-7 sal 
ea B, =, Y P;,4; + Ar r>1 
j=1 


Se deja fijo k, 1 < k < n. Por (9-7) se ve que la r-ésima columna de la matriz 
Ba o Bu 
INA 

se obtiene sumando a la r-ésima columna de 
An q. A 


LE 


una combinación lineal de sus otras columnas. Tales operaciones no alteran 
los determinantes. Lo que demuestra (9-6), a excepción de la observación tri- 
vial de que por ser B triangular, A,(B) = B,,, ---, Bi. Como A y P son in- 
versibles, B es inversible. Por tanto, 


A(B) = Bn --- Ban 0 
y así AA)+40,k=1,...,1n I 


Teorema 6. Sea f una forma en.un espacio vectorial V de dimensión finita 
y sea A la matriz de f en una base ordenada @. Entonces f es una forma positiva 
si, y solo si, A = A* y los menores principales de A son todos positivos. 


Demostración. Hagamos la mitad interesante del teorema. Supóngase que 
A = A* y que A,(4) > 0, 1 < k <n. Por el lema existe una matriz triangular 
superior (única) P con Pąą = 1 tal que B = AP es triangular inferior. La matriz 
P* es triangular inferior, con lo que P*B = P*AP es también triangular in- 
ferior. Como A es autoadjunta, la matriz D = P*AP es autoadjunta. Por el 
mismo razonamiento que llevó a (9-6), 


Ax(D) = AP*B) 
= A4B) 
= Ax(4). 


Como D es diagonal, sus menores principales son 
A(D) = Dn -+* Dux. 


De AD) > 0, 1 <k <n, se obtiene que D > 0 para todo k. 
Si A es la matriz de la forma:f en la base ordenada B = {œ}, ...., On}, En- 
tonces D = P*AP es la matriz de f en la base (0, .... œp} definida por 


A 
, 
aj = XA, Pijai. 
Kat 


Véase (9-2). Como D es diagonal.con elementos positivos en su diagonal, es 
obvio que ; 


X*DX>0 Xx0 


de lo que se sigue que f es una forma positiva. 

Ahora supóngase que f es una forma positiva. Se sabe que A = A*. ¿Cómo 
se demuestra que A,(4) > 0, 1 < k < n? Sea V, el subespacio generado por 
Qi, ---, 0% y sea fp la restricción de fa V, x V,. Evidentemente f, es una forma 


positiva en V, y, en la base (%,, ..., %,), está representada por la matriz 
An --- An 
An >- Am] 


Como consecuencia del Teorema 5 se observó que la positividad de la forma 
implica que el determinante de cualquier. matriz que la represente es positiva. | 


Quedan algunos comentarios por hacer para completar el estudio de la 
relación entre formas positivas y matrices. ¿Qué es lo que caracteriza las ma- 
trices que representan a las formas positivas? Si f es una forma en un espacio 
vectorial complejo y A es la matriz de f en cierta base ordenada, entonces f 
será positiva si, y solo si, A = A* y 


(9-8) X*AX >0, para todo X + 0 complejo 


Se sigue del Teorema 3 que la condición A = A* es redundante, es decir, que 
(9-8) implica 4 = A*. Por otro lado, si se tiene un espacio vectorial real, la forma 
f será positiva si, y solo si, A = A* y 


(9-9) X'AX >0, 


Hay que recalcar que si una matriz real A satisface (9-9) no se desprende de 
eso que A = A'. Lo que sí es cierto es que si se cumplen A = 4' y (9-9), enton- 
ces también se verifica (9-8). Y es porque 


(X + iY)*A(X + iY) = (X' — iY)A(X + iY) 
= X'AX + Y'AY + ¿[XA Y — Y'AX] 


ysi A = 4', entonces T'AX = X'AY. 

Si A es una matriz n x n de elementos complejos y si A satisface (9-9), se 
dirá que A es una matriz positiva. Los comentarios que acabamos de hacer 
pueden resumirse diciendo: en los casos real o complejo, una forma f es posi- 
tiva si, y solo si, su matriz en cierta base (de hecho, en toda) ordenada es una 
matriz positiva. 

Supóngase ahora que V es un espacio producto interno de dimensión finita. 
Sea f una forma no negativa en V. Existe un único operador autoadjunto T 
sobre V tal que 


(9-10) Fla, B) = (Talb). 


y T tiene, además, la propiedad de que (Taļæ) > 0. 


para todo X £ 0 real. 


Definición. Un operador lineal T sobre un espacio producto interno de di- 
mensión finita V es no negativo si T = T* y (Tala) > O para todo a. de V. Un 
operador lineal es positivo si T = T* y (Toja) > 0 para todo a + 0. 


Si V es un espacio vectorial (real o complejo) de dimensión finita, y si (- |) es 
un producto interno sobre V, hay una clase asociada de operadores lineales 
positivos sobre V. Mediante (9-10) existe una correspondencia biunivoca entre 
esta clase de operadores positivos y la colección de todas las formas positivas 
en V. Se usarán los ejercicios de esta sección para destacar la relación entre 
operadores positivos, formas positivas y matrices positivas. El siguiente resu- 
men puede ser de utilidad. 

Si A es una matriz n x n sobre el cuerpo de los números complejos, las 
siguientes afirmaciones son equivalentes. 

(1) A es positiva, es decir, 2 E Ay XX, > 0 siempre que Xy, ..., Xp Sean 

+ 


números complejos, no todos 0. 
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(2) (X|Y) = Y*AY es un producto interno en el espacio de las matri- 
ces complejas n x 1. 

(3) Respecto al producto interno canónico (X IY) = F*X de matrices 
n x L, el operador lineal X — AX es positivo. 

(4) A = P*P para alguna matriz inversible n x n, P, sobre C. 

(5) A = A*, y los menores principales de A son positivos. 

Si todo elemento de A es real, éstas equivalen a las siguientes: 

(6) 4=A*, y EE Ari po > 0 siempre que x,, ..., Xx, sean números 

J 


reales no todos nulos. 

(7) (X|Y) = Y'AX es un producto interno sobre el espacio de las ma- 
trices n x 1 reales. 

(8) Respecto al producto interno canónico (x| Y) = Y'X, sobre las ma- 
trices reales n x 1, el operador lineal X— AX es positivo. 

(9) Existe una matriz inversible n x n, P, con elementos reales tal que 
ASPE 


Ejercicios 


1. Sea V = C?, con el producto interno canónico. ¿Para cuáles vectores a de V hay un 
operador lineal positivo T tal que x = Te,? 
2. Sea V = R?, con el producto interno canónico. Si O es un número real, sea T el ope- 
rador lineal «rotación 0», 

Tokx,. X2) = (x, cos 0 — x, sen 0, x, sen O + x, cos 0). 
¿Para qué valores de O es Tọ un operador positivo? 
3. Sea V el espacio de las matrices n x 1 sobre C, con el producto interno (X| Y) -= Y*GX 
(donde G es una matriz n x n tal que éste sea un producto interno). Sean A una matriz 
n x ny Tun operador lineal T(X) = AX. Hallar 7*. Si Y es un elemento fijo de Y, hallar 
el elemento Z de V que determina el funcional lineal X— F*X. En otras palabras, hallar 
Z tal que Y*X = (X|Z) para todo X de V. 
4. Sea V un espacio producto interno de dimensión finita. Si 7 y U son operadores linea- 


les positivos sobre V, demostrar que (T + U) es positivo. Dar un ejemplo que muestre 
que TU no tiene que ser positivo necesariamente. 


5. Sea Pra li 3) 


(a) Demostrar que 4 es positiva. 
(b) Sea V el espacio de las matrices reales 2 x 1. con el producto interno (X| Y) = F'AX. 
Hallar una base ortonormal de V aplicando el proceso de Gram-Schmidt a la base [X',, X2} 


definida por 
x-[0) .=-[5) 


(c) Hallar una matriz real inversible 2 x I, P, tal que A = P'P 
6. ¿Cuáles de las siguientes matrices son positivas? 
LL 


o Enge arenak Ai 


mp tapai not 


oe o co 
E 


7. Dar un ejemplo de una matriz n x n que tenga todos sus menores principales positi- 
vos, pero que no sea una matriz positiva. 


8. CRE (Ca, xD y2)) = xF, + 2x37, + 2x172 + X272 un producto interno so- 
bre Ct? 


9. Demostrar que todo elemento de la diagonal principal de una matriz positiva es po- 
sitivo. 


10. Sea V un espacio producto interno de dimensión finita. Si T y U son operadores linea- 
les sobre V, se escribe T < U si U — T es un operador positivo. Demostrar lo siguiente: 
(a) T< U y U < T es imposible. 
(b) Si T< U y U < S, entonces T < S. 
(c) Si T< U y 0 < S, no es necesariamente ST < SU. 
11. Sean V un espacio producto interno de dimensión finita y E la proyección ortogonal 
de Y sobre algún subespacio. 
(a) Demostrar que, para cualquier número positivo c, el operador c/ + E es positivo. 
(b) Expresar por E un operador lineal autoadjunto T tal que T? = 1 + E. 


12. Sea n un entero positivo y A la matriz n x n 


1 1 1 
E is 
1 1 1 Sh 1 
Die 4 n+l 
3. 861 1 ] 1 
n n+1 n+2 2n- 1 


Demostrar que A es positiva. 


13. Sca A una matriz n x n autoadjunta. Demostrar que existe un número real e tal que 
la matriz c7 + A es positiva. 


14. Demostrar que el producto de los operadores lineales positivos es positivo si, y solo si. 
conmutan. 


15. Sean S y T operadores positivos. Demostrar que todo valor propio de ST es positivo. 


9.4. Más sobre formas 


Esta sección contiene dos resultados que dan información más detallada 
acerca de formas (sesquilineales). 


Teorema 7. Sean f una forma en un espacio vectorial real, o complejo, 
V y (2, ..., 0,) una base del subespacio W de V de dimensión finita. Sea M la 
matriz r x r de elementos 


My = fk aj) 
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y W' el conjunto de todos los vectores B de V tales que fia, PB) = 0 para todo a 
de W. Entonces W' es un subespacio de V y W N W' = {0} si, y solo si, MA es 
inversible. Si este es el caso, Y = W + W' 


Demostración. Si ß y y son vectores de W' y c es un escalar, entonces para 
todo a en W 


Fa, cp + Y) = Pod B) + fla, y) 


Luego, W' es un subespacio de V. 
r 


Supóngase ahora que «œ = 2 mues y que $ = È Yjaj. Entonces 
fla, b) = 2 TiM jktk 
-$ Majar 
Se sigue de esto que W M W' + {0} si, y solo si, el sistema homogéneo 
DAL =0, 1<k<r 


tiene una solución no trivial (y,, ..., y,). Luego W N W’ = {0} si, y solo si, 
M* es inversible. Pero ser M* inversible es equivalente a ser M inversible. 
Supóngase que M es inversible y sea 


A = (M* = (M-D*. 
Defínase g; sobre V por la ecuación 


046) = E, Af, A). 


Entonces 

gs(cB + y) = z Ajflar 8 + y) 
cz Anfa B) + z Af (axr, Y) 
cgi(B) + as(v). 


Luego toda g, es una función lineal sobre V. Así, pues, se puede definir un ope- 
rador lineal Æ sobre V haciendo 


[i 


EB = 2 gi(B)a;. 
s 
Como 
gilan) = z Añflor, An) 


= z Aal M*)in 


= Dim 


se sigue que Ela,) = a, para 1 < n < r. Esto implica que Ex = a para todo 
a de W. Por tanto, E aplica V sobre W y E? = E. Si $ es un vector arbitrario 
de V, entonces 


Slan EP) = f (e. z a6)as) 
= z GE lan a;) 
= z (z Anflos, 8)) Flan 05). 
Como A* = M”?, se sigue que 
Flan EB) = z (z M uMi) Faz, B) 
= z dinar, B) 


= flan B). 
Esto implica fla, Ef) = f(a, p) para todo a de W. Luego, 
fla, B — Ep) = 0 


para todo a de W y todo f de V. Así, Z — E aplica V en W”. La igualdad 
B = EB + (I — E)JB 


muestra que V = W + W”. Es de mencionar un último punto. Como W A 
W' = (0), todo vector de V es suma única de un vector de W y un vector de 
W”. Si B está en W' se sigue que Ef = 0. Luego 7 — E aplica V sobre W’. f 


La proyección E construida en la demostración puede caracterizarse de la 
siguiente manera: Ef = a si, y solo si, a está en W y f — a pertenece a W’. 
Así, E es independiente de la base de W utilizada en su construcción. Luego 
E se puede tratar como la proyección de V sobre W que está determinada por 
la descomposición en suma directa 


V=WOWw. 


Obsérvese que E es una proyección ortogonal si, y solo si, W' = W+. 


Teorema 8. Sean f una forma en un espacio vectorial real, o complejo, V y 
A la matriz de f en la base ordenada [a,, ..., a) de V. Supóngase que los me- 
nores principales de A son todos distintos de O. Entonces existe una única matriz 
triangular superior P con Pa, = 1 (1 < k < n) tal que 
P*AP 
es triangular superior. 


Demostración. Como A,(4*) = A,(4) (1 < k < n), los menores principa- 
les de A* son todos distintos de 0. Luego, por el lema utilizado en la demos- 
tración del Teorema 6, existe una matriz triangular superior P con P, = 1 


tal que A*P es triangular inferior. Por tanto, P*A = (A*P)* es triangular su- 
perior. Como el producto de las matrices triangulares superiores es también 
triangular superior, se sigue que P*AP es triangular superior. Esto muestra 
la existencia, pero no la unicidad de P. Sin embargo, hay otro razonamiento, 
más geométrico, que puede usarse para demostrar la existencia y unicidad de P. 

Sean W, el subespacio generado por ay, ..., Ox y Wy el conjunto de todos 
los f de V tales que fía, p) = O para todo a de W,. Como AJA) + 0, la ma- 
triz k x k, M, de elementos 


Mi; = flo; 05) = As 
(1 < i, j < k) es inversible. Por el Teorema 7 
V=W0VW:. 


Sea E, la proyección de V sobre W, determinada por esta descomposición, y 
sea Ey = 0. Sea 


Bk = ar — Eriak, (1<k<m). 


Entonces f, = a, y E, 10% pertenece a W,-., para k > 1. Así, cuando k > 1, 
existen escalares únicos P; tales que 


k—1 
Eia = — 2 Praj. 
del 


Haciendo Py = 1 y Pa = 0 para j > k, se tiene entonces una matriz n x n 
triangular superior P con Pi = 1 y 


k 
B= Y Pira; 
j=1 
para k = 1, ..., n. Supóngase que 1 < i < k. Entonces Bi está en W, y 
W, C Wi,-1. Como fp pertenece a W,- 1, se sigue que Bi Pr) = 0. Sea B la 
matriz de f en la base ordenada {$,, ..., P,). Entonces 


Bu = Fs Bu) 
con lo que Bj; = 0 cuando k > ¡. Así B es triangular superior. Por otro lado, 
B = P*AP. 


Recíprocamente, supóngase que P es una matriz triangular superior con 
Pu = 1 tal que P*AP es triangular superior. Se hace 


Br = E Paj (1<k<m. 
E 
Entonces [f,, - . - , Pa} es evidentemente una base de W,. Supóngase que k>l 


Entonces (8, - - .. Pk-ı} es una base para W,_ ,, y como f(B;, Pk) = 0 cuando 
i < k, se ve que f, es un vector de W;_,. La ecuación que define f implica 


'k—1 
AA (z Pres) + p- 


k-1 
Ahora bien, E Py0,pertenecea W,- Y Prestá en Wi_,.Portanto, Pjz, ... > Pi-1x 
j=k à 


son los únicos escalares tales que 


k—1 
Erna = — 2 Pra; 
ja 


con lo que P es la matriz construida anteriormente. |] 


9.5. Teoría espectral 


En esta sección prosiguen las consecuencias de los Teoremas 18 y 22 del 
Capitulo 8 referentes a la diagonalización de operadores autoadjuntos y normales. 


Teorema 9 (teorema espectral). Sea T un operador normal sobre un espacio 
producto interno complejo de dimensión finita V o un operador autoadjunto sobre 
un espacio producto interno real de dimensión finita V. Sean c1, . . - , Cy los valores 
propios distintos de T. Sea W, el espacio propio asociado a c; y E, la proyección 
ortogonal de W sobre W,. Entonces W; es ortogonal a W, si i + j, V es la suma 
directa de W,,..., Wg y 


(9-11) T= E, +: +1 Er. 


Demostración. Sea a un vector de W;, P un vector de W; y supóngase que 
i + j. Entonces c(a]8) = (Talp) = (a| T*p) = (a|ē;b). Luego (c; — &Malf)=0 
y, como c, — c; $ 0, se sigue que (0, B) = 0. Asi W; es ortogonal a W; si: + j. 
Del hecho de que V tiene una base ortonormal de vectores propios (véanse 
Teoremas 18 y 22, del Capítulo 8), se sigue que V = W, +-+: + H, Si aj 
pertenece a V; (1<j<k)y 0 +: += 0, entonces 


0= («12 aj) = z (aila;) 
= |la;ll? 


para todo i, con lo que V es la suma directa de W,, ..., Wp. Por tanto, 
E+ +E =y 


T=TE + -+ TE: 
= aE + -> + Er 1 


La descomposición (9-11) se llama descomposición espectral de T. Esta ter- 
minología proviene en parte de aplicaciones físicas que han hecho que se de- 
fina el espectro de un operador lineal sobre un espacio vectorial de dimensión 
finita como el conjunto de valores propios para el operador. Es importante 
observar que las proyecciones ortogonales £4, ..., E, están asociadas canóni- 
camente con T; en realidad, son polinomios en T. 


Coroiario. Si e, = II C= entonces E, = e(T) para rers k 
itj NG 


Demostración. Como EE¡=0 si i + j, se sigue que 
T? = åE, + --- + ĠEr 
y por un sencillo razonamiento inductivo que 
Tr = AE + --- + Ez 


para todo entero n > 0. Para un polinomio arbitrario 


f= È, ant" 
se tiene z 
KT) = È aT" 


n=0 


r k 
Z 03 GE; 
n=0 j=1 


k r 
p2 (ż an 5) E, 
=1 \n=0 


J 


A 
= A Fc) E; 


Como e;(Cm) = Ó;m, se sigue que e(T)= E. Y 
Por estar E,, ..., E, asociados canónicamente con T y 
I=E14+ ++ +Ex 


La familia de proyecciones (E,,..., E,) se llama descomposición de la identidad 
definida por 7. 

Cabe hacer un comentario respecto a la demostración del teorema espec- 
tral. Se derivó el teorema usando los Teoremas 18 y 22 del Capítulo 8 sobre 
la diagonalización de operadores autoadjuntos y normales. Hay otra demos- 
tración más algebraica, en la que debe demostrarse primero que el polinomio 
minimal de un operador normal es un producto de factores primos distintos. 
Luego se procede como en la demostración del teorema de la descomposición 
prima (Teorema 12, Capítulo 6). Daremos una demostración así en la siguien- 
te sección. 

En diversas aplicaciones es necesario saber si se pueden calcular ciertas 
funciones de operadores o matrices, v.gr., raíces cuadradas. Esto se puede hacer 
muy sencillamente para operadores normales diagonalizables. 


Definición. Sea T un operador normal diagonalizable sobre un espacio pro- 
ducto interno de dimensión finita V y sea 


su resolución espectral. Supóngase que f es una función cuyo dominio incluve 


el espectro de T, que tenga valores en el cuerpo de los escalares. Entonces el ope- 
rador lineal f(T) está definido por la igualdad 


k 
19-12) AT) = E MODE, 


7 i. tro S en. 
Teorema 10. Sea T un operador normal diagonalizable con espec e 
un espacio producto interno de dimensión finita V. Supóngase que f es una función 
cuyo dominio contiene a S y que toma valores en el cuerpo de los escalares. Enton- 
ces f(T) es un operador normal diagonalizable de espectro JS). Si U es una apli- 
Bacio unitaria de V sobre V' y T’ = UTU” ', entonces S es el espectro de T' y 
AT) = UNT” 
Demostración. La normalidad de f(T) se desprende de un sencillo cálculo 
a partir de (9-12) y de que 
FU) = ENE; 
1 


Además, es evidente que para todo a en E,(V) 
f(Tja = feia. 


Así, el conjunto f(S) de todos los f(c) con e en S está contenido en el espectro 
de f(T). Recíprocamente, supóngase que a + 0 y que 


F(T)a = ba. 
Entonces a = 2 Eja y 

i KT)a = ESD)Esa 

3 
í = Z f(c)Eja 

J 

= E bE;a. 
3 


Luego 
IIZ (6) — DEsall? = E |fe) — bl’llEall? 
j i 
=0. : Se 
Por tanto, f(c;) = b o Eja = 0. Por hipótesis, a + 0, así que existe un índice 
a £ 


i pará el que Eja + 0. Se sigue que f(c) = b y por consiguiente que f(S) es el 
espectro de f(T). Supóngase, en efecto, que 


KS) = {bu - - - , br) 


i j indices i tales que 1 < į < k 
donde b,, + b, si m + n. Sea Xm el conjunto de índices i tales 
SI = A . Sea P„ = Y E, la suma extendida a los índices į de Xm. Enton- 


ces P,, es la proyección ortogonal de V sobre el espacio de los vectores propios 
que corresponden a los valores propios bm de f(T), y 


IT) = E baPa 
es la descomposición espectral de f(T). 


Supóngase ahora que U es una transformación unitaria de V sobre Y” y 
que 7" = UTU”*. Entonces la igualdad 


Ta = ca 


vale si, y solo si, 
T'Ua = cUa. 


Así que S es el espectro de T’, y U aplica todo subespacio propio para T sobre 
el correspondiente subespacio para T’. En efecto, por (9-12), se tiene que 


T' = 3 GE), E; = UE,U-1 
2 
es la descomposición espectral de T’. Luego 


KT) = ZSE; 


= Z f(a) UE;U~ 
j 


U (ESE) va 


Uf(T)U~. I 
Pensando en el análisis anterior, es importante tener presente que el es- 
pectro del operador normal T es el conjunto 
S= fey e Y 


de valores propios distintos. Cuando T está representado por una matriz dia- 
gonal en una base de vectores propios es necesario repetir cada valor c; tantas 
veces como la dimensión del correspondiente espacio de vectores propios. 
Esta es la razón del cambio de notación en el siguiente resultado. 


Corolario. Con las hipótesis del Teorema 10, supóngase que T está repre- 
sentado en la base ordenada @ = (a,, .... a,) por la matriz diagonal D de ele- 
mentos dı, ...., d,. Entonces, en la base @, f(T) está representada por la matriz 
diagonal f(D) de elementos f(d,), ..., f(d,). Si B' = 1%, ..., 0%, ) es otra base 
ordenada cualquiera y P es la matriz tal que 


a = E Pj 
entonces P*f(D)P es la matriz de f(T) en la base @'. 


Demostración. Para cada índice i existe un único j tal que 1 < ¡<k, 
a, pertenece a E(V) y di = c;. Luego f(T)a, = fíd,Jo,, para todo i, y 


Da = EP :f(Tjo; 
Dip, 
= z (DP) ¡ja 
= 2 (DP), Z Pa'at 


= z (PDP) soa A 


Se sigue de este resultado que pueden formarse ciertas funciones de una 
matriz normal. Pues supóngase que A es una matriz normal. Entonces existe 
una matriz inversible P, en realidad una matriz unitaria P, tal que PAP”! es 
diagonal, sea D con elementos d,, ..., d,. Sea f una función compleja que 
se pueda aplicar a d,, ..., d, y sea f(D) la matriz diagonal con elementos 
fid,), -.., Sd,). Entonces P7*f(D)P es independiente de D y es una función 
de A en el siguiente sentido: Si Q es otra matriz inversible tal que QAQ”* sea 
una matriz diagonal D’, entonces f puede aplicarse a los elementos de la dia- 
gonal de D', y 


P=f(D)P = QSD’. 
Definición. En las condiciones anteriores, f(A) se define como P”'f(D)P. 
La matriz f(A) puede ser también caracterizada de un modo distinto. Al ha- 
cerlo se enuncian sin demostración algunos de los resultados sobre matrices 


normales que se obtienen al formular los teoremas con matrices análogos de 
los teoremas anteriores. 


Teorema 11. Sean A una matriz normal y Cy, ... 
complejas de det {xl — A). Sea 


x—c; 
e= 0 (2 
iti NGT Cj 


y E, = e(A) (1 < i < k). Entonces E,E; = 0 cuando i.+ j, E? = E, E? = El, y 
I= E, + t E 


> C, las distintas raices 


Si f es una función compleja cuyo dominio yncluye a Cy, ... 
HA) = fE +: + JAJEs; 


en particular, A = CE, + +++ + ChEz. 


> Ck, Entonces 


Recordemos que un operador en un espacio producto interior V es no ne- 
gativo si T es autoadjunto y (Tax) > O para todo a de V. 


Teorema 12. Sea T un operador diagonalizable normal sobre un espacio 
producto interno de dimensión finita V. Entonces T es autoadjunto, no negativo, 
o unitario, según que cada valor característico de T sea real, no negativo, o de 


«valor absoluto 1. 


Demostración. Supóngase que T tenga descomposición espectral T = 
CE, +++: + cx E,, entonces T* =€,E, + +++ + €,E,. Decir que T es auto- 
adjunto es decir que T = T*, o 

(a — EYE1L + +++ + (c+ — TJ) Er = 0. 


Valiéndose de que E,E, = 0 para i + j y de que ningún E; es el operador cero, 


se ve que T es autoadjunto si, y solo si, c; = ĉj j = 1, ..., k. Para distinguir 
los operadores normales que son no negativos, obsérvese que 


k k 
(Pala) = ( È cka Y Ea) 
j=1 i=l 
= EE cLjalEa) 
ij 
= Y ej]|£jal|?. 


Hemos usado el hecho de que (Eja|E,a) = 0 para i + j. De esto resulta que 
la condición (Ta Ja) > O se satisface si, y solo si, c; > 0 para todo j. Para dis- 
tinguir los operadores unitarios obsérvese que 


TT* = Ga + -+ + 0xEx 
ha lc1]?E, Apis lcr[? Es. 


Si. TT* = I, entonces F= |c,|?E, +--+ + |cg]?E,, y operando con Ej, 
E; = (c,|?E,. 


Como E; + 0, se tiene que |c;|? = 1, o |c;| = 1. Recíprocamente, si loe =1 
para cada j, es evidente que TT* = I. 


Es importante hacer notar que éste es un teorema sobre operadores norma- 
lès. Si T es un operador lineal general sobre V, que tiene valores propios reales, 
no se sigue que T sea autoadjunto. El teorema dice que si T tiene valores propios 
reales y si T es diagonalizable y normal, entonces T es autoadjunto. Un teorema 
de este tipo sirve para reforzar la analogía entre la operación de adjunción y 
el procesa de formar el conjugado de un número complejo. Un número com- 
plejo z es real o de valor absoluto 1 según que z = Z, o zz = 1. Un operador 
T es autoadjunto o unitario según que T = T* o TF* = I. 

Se demostrarán ahora dos teoremas análogos de las dos afirmaciones si- 
guientes: 


(1) Todo número no negativo tiene una única raíz cuadrada no negativa. 

(2) Todo número complejo se puede expresar en la forma ru, con r no 
negativo y |u| = 1. Esta es la descomposición polar z = rel” de los números 
complejos. 


Teorema 13. Sean V un espacio producto interno de dimensión finita y T un 
operador no negativo sobre V. Entonces T tiene una única raíz cuadrada no nega- 
tiva. esto es, existe un operador no negativo N, y solo uno, de V tal que N? = T. 


Demostración. Sea T = cE; +--> + CE, la descomposición espectral 
de T. Por el Teorema 12, todo c; > 0. Si c es cualquier número real no negativo, 


sea Je la raíz cuadrada no negativa de c. Entonces, conforme al Teorema 11 


y a (9-12), N = JT es un operador diagonalizable normal bien definido sobre 
V. Es no negativo por el Teorema 12 y, por un cálculo obvio, N? = T. 


Ahora sea P un operador no negativo sobre V tal que P? = T. Sea demos- 
trar que N = P. Sea 


P = dfi + --- + dF, 


la descomposición espectral de P. Entonces d; > O para todo j, pues P es no 
negativo. De P? = T se tiene 


T = Fi + --- + ĠF, 


Ahora F,, ..., F, cumple las coridiciones F= F, +++: + F, FF; = 0 para 
i + j, y ningún F; es 0. Los números di, .. ., d? son distintos, ya que números 
no negativos distintos tienen raíces cuadradas distintas. Por la unicidad de la 
descomposición espectral de T, se tiene r = k y (si acaso por reordenación) 
F, = Ej, dj =cCj. Así que P=N. | 


Teorema 14. Sea V un espacio producto interno de dimensión finita y sea 
T un operador lineal cualquiera sobre V. Entonces existen un operador unitario 
U sobre V y un operador no negativo N sobre V tales que T = UN. El operador 
N no negativo es único. Si T es inversible, el operador U es también único. 


Demostración. Supóngase que T = UN, donde U es unitario y N es no 
negativo. Entonces T* = (UN)* = N*U* = NU*, Así T*T = NU*UN=N?. 
Esto muestra que N está univocamente determinado como la raíz cuadrada 
no negativa del operador no negativo T*T. 

De modo que para comenzar con la demostración de la existencia de U y 
de N, se usa el Teorema 13 para definir N como la única raíz cuadrada no ne- 
gativa de T*T. Si T es inversible, también lo es N, pues 


(ValNa) = (N?ala) = (T*Tala) = (Ta|Ta). 


En este caso se define U = TN”! y se demuestra que U es unitario. Ahora bien, 
U* = (TNT )* = (N7*T* = (N*) 1T* = N”*T*. Así que 


UU* = TNAN=T* 
T(N)T* 
T(N)T* 
P(T*T)- TA 
= TTAUT*)T* 
=I 


1l 


y U es unitario. 

Si T no es inversible hay que proceder en forma más laboriosa para definir 
U. Primeramente se define U sobre la imagen de N. Si a es un vector de esta ima- 
gen, por ejemplo, a = N$. Se define Ua = Tf, motivado por el hecho de que 
se quiere que UNB = T$: Debe verificarse que U está bien definido sobre la 
imagen de N; es decir, si Nf$' = NB, entonces Tf" = Tf. Se verificó anterior- 
mente que || Ny]? = ||Ty||? para todo y en V. Así, con y = P — $’ se ve que 
N(B — P’) = 0 si, y solo si, T(B = B'Y= 0. Con lo que U está bien definido 
sobre la imagen de N y es evidentemente lineal donde está definido. Ahora 
bien, si VW es la imagen de N, se definirá U sobre WŁ. Para ello se necesita la 


siguiente observación. Como T y N tienen el mismo espacio nulo, sus imágenes 
tienen la misma dimensión. Así W* tiene la misma dimensión que el comple- 
mento ortogonal de la imagen de 7. Por tanto, existe un isomorfismo (de espacio 
producto interno) Uo de W+ sobre T(V)*. Ahora se ha definido U sobre W, 
y se define U sobre W+ como Uo- 

Se repite la definición de U. Como V = W @ W+, todo a de V está expre- 
sado univocamente en la forma a = Nf + y, donde N$ está en la imagen W de 
N y y está en W+. Se define 

Ua = TB + Uvr. 


Este U es evidentemente lineal, y se verificó anteriormente que está bien de- 
finido. Así, pues,” 


(Ua|Ua) = (TB + Uoy|T8 + Usr) 
= (TB|T8) + (Uoy|Uoy) 
= (NBINB) + (ly) 
= (ala) 


y entonces U es unitario. También tenemos que UNf = Tf para todo f. J 


T = UN se le llama una descomposición polar de 7. Por cierto que no se 
le puede llamar la descomposición polar, ya que U no es único. Aun cuando 
T sea inversible, con lo que U es único, tenemos la dificultad de que U y N pueden 
no conmutar. Ciertamente, conmutan si, y solo si, T es normal. Por ejemplo, 
si T = UN = NU, con N no negativo y U unitario, entonces 


TT* = (NUNNU)* = NUU*N = N? = T*T. 

El operador general T tendrá también una descomposición T = N, U, con N, 
no negativo y U, unitario. Aquí N, será la raíz cuadrada no negativa de TT*. 
Se puede obtener este resultado aplicando el teorema que se acaba de demostrar 
al operador 7*, y tomando luego adjuntos. 

Pasamos ahora al problema de qué se puede decir respecto a la diagona- 
lización simultánea de familias conmutativas de operadores normales. Para 
este propósito es adecuada la siguiente terminología. 


Definiciones. Sea F una familia de operadores sobre un espacio producto 
interno V. Una función r sobre $, con valores en el cuerpo F de los escalares, se 
llamará una raíz de F si existe un a no nulo de V tal que 


Ta = r(Tja 
para todo T de $. Para cualquier función r de Ș en F, sea V(r) el conjunto de todos 
los x de V tales que Ta = r(T)a para todo T en $. 


Entonces V(r) es un subespacio de V y r es una raiz de $ si, y solo si, V(r) + 0. 
Todo x no nulo de V(r) es simultáneamente un vector propio para todo T de $. 


Teorema 15. Sea Í una familia conmutativa de operadores normales diago- 
nalizables en un espacio producto interno de dimensión finita V. Entonces $ tiene 


producto merno 


wilo un número finito de raices. Si ry.. . fp son las raíces distintas de $, entonces 


G) Vír,) es ortogonal a V(r;) cuando i + j, y 
GD K= Fre- O Vir). 


Demostración. Supóngase que r y s son raices distintas de $. Entonces 
existe un operador T en $ tal que r(T) + s(T). Como los vectores propios que 
corresponden a valores propios distintos de T son necesariamente ortogonales. 
se sigue que V(r) es ortogonal a V(s). Como V es de dimensión finita. esto im- 
plica que $ tiene a lo más un número finito de raíces. Sean r}, . - . , r, las raíces 
de $. Supóngase que (Ti. ..., T,,) es un subconjunto maximal de 3 lineal- 
mente independiente y sea 


{En En...) 


la descomposición de la identidad definida por T, (1 < i < m). Entonces las 
proyecciones E; forman una familia conmutativa, pues toda E;, es un polinomio 
en T; y Ti. .... Tẹ, conmutan entre sí. Como 


I = (2 £i5) (Z E5) +++ (E Emin) 
n n Jm 


todo vector x de V puede escribirse en la forma 


(9-13) a= bA / Es Ezjx + ** Emo. 

Mer.» Jm 
Supóngase que ji, - jm son los índices para los que $ = E, ;,E>;, * °° Emjm 0. 
Sea 


Bi = (1 Enj.) a. 
ni 
Entonces f = E,¡f;; luego existe un escalar c; tal que 


TB = cp, 1<i<m. 


Para cada T en $ existen escalares únicos b, tales que 


T= Y bfi 
i=1 
Asi Tp = E b:T:B 
= (2 bici) b. 


La función T— Y b,c, es evidentemente una de las raíces, por ejemplo, r, de $, 


v [$ está en V(r,). Por tanto, cada término no nulo en (9-13) pertenece a uno 
de los espacios Vír¡)...., V(r,). Se sigue que V es la suma directa ortogonal 
de Vir). .... FRL S 


Corolario. En la hipótesis del teorema, sea P; la proyección ortogonal de 
V sobre Vir¡), (1 < j < k). Entonces P,P; = 0Osii4j 


=P 424 Pa, 
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y todo T de $ puede ser escrito en la forma 
(9-14) T=YE (DP, 
j 


Definiciones. La familia de las proyecciones ortogonales 1P,. .... PA se 
llama descomposición de la identidad determinada por $ y (9-14) es la descomposición 
espectral de 7 según esta familia. 


Aunque las proyecciones P,, ..., P, del corolario anterior están asocia- 
das canónicamente con la familia $, no están generalmente en $, ni son siquiera 
combinaciones lineales de operadores de $; sin embargo, veremos que se pue- 
den obtener por la formación de ciertos productos de polinomios en elemen- 
tos de F. 

Para el estudio de una familia de operadores en un espacio producto interno 
suele ser provechoso considerar el álgebra autoadjunta generada por la familia. 


Definición. Un álgebra autoadjunta de operadores sobre un espacio producto 
interno V es un subálgebra lineal de L(V, V) que contiene el adjunto de cada uno 
de sus elementos. 


Ejemplo de álgebra autoadjunta es el mismo L(V, V). Como la intersec- 
ción de cualquier colección de álgebras autoadjuntas es a su vez un álgebra 
autoadjunta, la siguiente terminología tiene sentido. 


Definición. Si F es una familia de operadores lineales sobre un espacio pro- 
ducto interno de dimensión finita, el álgebra autoadjunta generada por $ es la 
menor álgebra autoadjunta que contiene a $. 


Teorema 16. Sea $ una familia conmutativa de operadores diagonalizables 
normales sobre un espacio producto interno de dimensión finita V y sea Q el ál- 
gebra autoadjunta generada por $ y el operador identidad. Sea 1P,, .... P) la 
descomposición de la identidad definida por $. Entonces Q es el conjunto de todos 
los operadores sobre V de la forma 


k 
(9-15) T= 2 oP; 


j=1 
donde Cy, .... Cx son escalares arbitrarios. 


Demostración. Sea Œ el conjunto de todos los operadores sobre Y de la 
forma (9-15). Entonces Œ contiene al operador identidad y el adjunto 


T* = GP; 
j 
para cada uno de sus elementos. Si T = E c;P; y U = 2 d;P;, entonces pará 
i i 
todo escalar a 


aT + U = Y (ac + d)P} 
3 


Algebra lineal | 


TU = EcdiPL, 
43 
= Y cd;P; 
EJ 


= UT. 
Asi que Œ es un álgebra autoadjunta conmutativa que contiene a $ y al ope- 
rador identidad. Por tanto, € contiene a G. 

Ahora sean r}, .... rą todas las raices de $. Entonces, para todo par de 
indices (i, n) con i +Æ n, existe un operador 7,, en $ tal que r,(7;,) + r, (Tn). 
Sea din = "A Tin) — "nt Tin) Y bin = rn(Tin). Entonces el operador lineal 

Qi = II am (Tin — binl) 
n*i 
es un elemento del álgebra @. Se demuestra que Q; = P, (1 < i < k). Para 
ello, supóngase que j + i y que a es un vector arbitrario en V(r;). Entonces 
Tua = r;(Ti;)a 
= bija 
de modo que (T;; = b;,1 Ja = 0. Como todos los factores en Q; conmutan, se 


sigue que Q;« = 0. Luego Q; coincide con P, en Vír;) si j + i. Supóngase ahora 
que g es un vector de V(»,). Entonces Ta = r¡(T;,)0. y 


Qin (Tin — dinl)a = ain'[r: (Tin) — Tu(T in) la = a. 
Así, pues, Q;æ = a y Q; coincide con P, en V(r;): por tanto, Q; = P; para i = 
l, ..., k. De lo cual se sigue que Q = €. | 


El teorema muestra que el álgebra @ es conmutativa y que cada elemento 
de @ es un operador normal diagonalizable. Se demuestra a continuación que (t 
tiene un solo generador. 


Corolario. Con las hipótesis del teorema existe un operador T en Q tal que 
todo elemento de Q es un polinomio en T. 


k 
Demostración. Sea= Y P; con ti, - . . , Ig son escalares distintos. Entonces 
j=1 
k 
T” = 3 GP, 
j=1 
para n= |, 2, ... Si 
f= Y aa" 
n=1 
se sigue que r 
a k 
ND)= Z aT"= Y 3 EE 
n=1 n=1j=1 
k s 
=2 (3 anti) P; 
j=1 \n=1 
k 
= 2 f()P, 
i=] 


T Pu 


Dado un 


arbitrario en G, existe un polinomio f tal que f(t,) =c; (1 < j < k) y, pa 
cualquier tal f, U = f(T). | 


Ejercicios 


1. Dar una definición razonable de una matriz n x n no negativa y demostrar luego q 
tal matriz tiene una única raiz cuadrada no negativa. 
2. Sea A una matriz n x n con elementos complejos tal que A* = —4 y sea B= ai 
Demostrar que 

(a) det B = e" 4; 

(b) B* = e74: 

(c) B es unitaria. 


3. Si U y T son operadores normales que conmutan, demostrar que U + T y UT son 


normales. 


4. Sea T un operador lineal sobre un espacio producto interno de dimensión finita V. 
Demostrar que las diez siguientes afirmaciones respecto a T son equivalentes: 

(a) T es normal. 

(b) I|7a]] = ||T*zx|| para todo x en Y. 

(c) T= T, + ¡¿T,. donde T, y T, son autoadjuntos y 7,7, = T,T,. 

(d) Si x es un vector y ¢ un escalar de modo que Tx = cx, entonces T*% = ĉa. 

(e) Existe una base ortonormal de V formada por vectores propios para T. 

(f) Existe una base ortonormal (3 tal que [7] g es diagonal. 

(g) Existe un polinomio g con coeficientes complejos tal que 7* = g(T). 

(h) Todo subespacio invariante por T es también invariante por 7*. 

(i) T= NU, donde N es no negativo, U es unitario, y N conmuta con U. 

(1) T=cT, +> + E, donde I= E, +>>-+ Ep EE; = 0 para i + j y Ej = 
E, = Ef. 


5. Usar el Ejercicio 3 para mostrar que cualquier familia conmutativa de Operadores nor- 
males (no necesariamente diagonalizables) en un espacio producto interno de dimensión 
finita genera un álgebra autoadjunta conmutativa de operadores normales. 


6. Sean V un espacio producto interno complejo de dimensión finita y U un operador 
unitario sobre V tal que Ux = x implique x = 0. Sea 


y demostrar que 
(a) NU) = il+ UNI — Uy? 
(b) FU) es autoadjunto. 
(c) para todo operador autoadjunto T sobre Y. el operador 


U=(T -il(T+in= 
es unitario y tal que T = fiU). 


7. Sea V el espacio de las matrices complejas n x n con el producto interno 
(AIB) = tr (AB*”). 


Si B es un elemento de V, sean Ly, Ry y Tp los operadores lineales sobre V definidos por 
(a) Es(A) = BA. 
(b) Re(4) = AB. 
(c) Ts(A) = BA — AB. 


Considerar las tres familias de operadores que se obtienen al hacer variar B sobre todas 
las matrices diagonales. Demostrar que cada una de estas familias es un álgebra autoadjunta 
conmutativa y hallar sus descomposiciones espectrales. 


8. Si Bes un elemento del espacio producto interno del Ejercicio 7, hacer ver que /, es equi- 
valente unitariamente a Ry. 


Y. Sean V el espacio producto interno del Ejercicio 7 y G el grupo de matrices unitarias 
de V. Si B está en G, sea Cp el operador lineal sobre Y definido por 
Cs(A) = BAB”. 
Demostrar que 
(a) Cp es un Operador unitario en V; 
(b) Cum, = Cu Ch: 
(c) no existe una transformación unitaria U en V tal que 


ULsU~ = Cp 
para todo B de G. 


10. Sean $ una familia cualquiera de operadores lincales sobre un espacio producto in- 
terno de dimensión finita V y Q el álgebra autoadjunta generada por $. Demostrar que 
(a) toda raíz de @ define una raiz de $: 
(b) toda raíz r de G es una función lineal multiplicativa sobre A, es decir, 


r(TU) = r(T)r(U) 
r(cT + U) = cr(T) + r(U) 


para todo T y U de Q y todo escalar c. 


1. Sea F una familia conmutativa de operadores diagonalizables normales sobre un 
espacio producto interno de dimensión finita V y sea @ el álgebra autoadjunta generada 
por $ y el operador identidad /. Demostrar que toda raiz de @ es distinta de 0 y que para 
toda raíz r de $ existe una raíz única s de Q tal que s(T) = r(T) para todo T de $. 


12. Sean $ una familia conmutativa de operadores diagonalizables normales en un es- 
pacio producto interno de dimensión finita V y G, el álgebra autoadjunta generada por $. 
Sea Q el álgebra autoadjunta generada por $ y el operador identidad / Demostrar que 

(a) Q es el conjunto de todos los operadores sobre V de la forma cl + T., donde c es 
un escalar y 7T un operador en Go. 

(b) Existe a lo más una raiz r de Q tal que r(T) = 0 para todo T de Go. 

(c) Si una de las raices de @ es 0 sobre Go. las proyecciones P}, ...., P, en la descom- 
posición de la identidad definida por $ pueden ser rotuladas mediante indices de tal modo 
que Qo conste de todos los operadores sobre Y de la forma 


k 
T= Y cP; 
j=2 


donde c3. .... c€ son escalares arbitrarios. 
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(d) Q = G, si, y solo si, para cada raíz r de @ existe un operador 7 en @o tal que 
r(T) 40. 


9.6. Otras propiedades de los 
operadores normales 


En la Sección 8.5 se han expuesto las propiedades básicas de los operadores 
autoadjuntos y normales usando el método más simple y directo posible. En 
la Sección 9.5 se consideraron varios aspectos de la teoría espectral. Aquí de- 
mostraremos algunos resultados de naturaleza más técnica y que se refieren 
principalmente a operadores normales sobre espacios reales. 

Se comenzará demostrando una versión más precisa del teorema de des- 
composición prima del Capítulo 6 para operadores normales. Será válido para 
ambos casos el real y el complejo. 


Teorema 17. Sea T un operador normal sobre un espacio producto interno 
de dimensión finita V. Sea p el polinomio minimal para T y Py. . ++, Pk SUS dis- 
tintos factores primos mónicos. Entonces cada p; tiene multiplicidad 1 en la fac- 
torización de p y tiene grado 1 o 2. Supóngase que W; es el espacio nulo de pT). 
Entonces 


(1) W, es ortogonal a W;, si i + j; 
(ii) V=W0:::0Wi 
Gii) W; es invariante por T y p; es el polinomio minimal para la restricción 
de Ta W;; 
(iv) para todo j existe un polinomio e, con coeficientes en el cuerpo de los 
escalares tal que e¡(T) es la proyección ortogonal de V sobre W). 


En la demostración usaremos ciertos hechos básicos que sentaremos como 
lemas. 


Lema 1. Sea N un operador normal sobre un espacio producto interno W. 
Entonces el espacio nulo de N es el complemento ortogonal de su imagen. 


Demostración. Supóngase que («|N8)= 0 para todo ff de W. Entonces 
(N*a]f8) = 0 para todo f: luego N*a = 0. Por el Teorema 19 del Capítulo 8 
esto implica que Na = 0. Recíprocamente, si Na = 0 entonces N*a=0 y 


(N*ajg) = (elN6) = 0 
para todo f de W. I 


Lema 2. Si N es un operador normal y x es un vector tal que N?g = 0, 
entonces Na = 0. 


Demostración. Supóngase que N sea normal y que N?°«a = 0. Entonces 
Nx está en la imagen de N y también en el espacio nulo de N. Por el Lema 1, 
esto implica que Na = 0. f 


Lema 3. Sean T un operador normal y f cualquier polinomio con coeficien- 
tes en el cuerpo de los escalares. Entonces f(T es también normal. 


Demostración. Supóngase que f = dy + ax + *** + ax”. Entonces 


FT) =al + aT + -e H aT” 


AT) = ml +T + lT 
Como T*T = TT*, se sigue que f(T) conmuta con f(T)*. I 


Lema 4. Sean T un operador normal y f, g polinomios primos relativos 
con coeficientes en el cuerpo de los escalares. Supóngase que x y ß-son vectores 
tales que (Ta = 0 y g(T)B = 0. Entonces (ajf) = 0. 

Demostración. Existen polinomios a y b con coeficientes en el cuerpo de 
los escalares tales que af + bg = 1. Así 


ADT) + MI) = I 
y x = g(T)MT )z. Se sigue que 
(alB) = (a(TI5Dal8) = (b(T)alg(T)*B). 


Por suposición, g(T)f = 0. Por el Lema 3, g(T) es normal. Por tanto. por el 
Teorema 19 del Capítulo 8, g(T)*f = 0; luego (x|f8) =0. E 


Demostración del Teorema 17. Se recuerda que el polinomio minimal 
para T es el polinomio mónico de grado menor entre todos los polinomios f 
tales que /(T) = 0. La existencia de tales polinomios se desprende de la supo- 
sición de que V es de dimensión finita. Supóngase que un factor primo p; de p 
está repetido. Entonces p = pjg para algún polinomio g. Como p(T) = 0, se 
sigue que 

(p(T)Pg(T)a = 0 


para todo a de V. Por el Lema 3, p;(T) es normal. Así, el Lema 2 implica que 
pi(Tig(T)a = 0 
para todo a de V. Pero esto contradice la suposición de que p tiene el menor 


grado entre todos los f tales que f(T) = 0. Por tanto, p = pı *** py. Si V es 
un espacio producto interno complejo. todo p; es necesariamente de la forma 


Pa T-— C 
con c; real o complejo. Por otro lado, si V es un espacio producto interno real. 
entonces +j = x;— cj con cen Ro 
pi = (z — ca — 2) 
donde « es un número complejo no real. 


Alecbra 


Sea ahora Ji = p!p;- Entonces, como fi, .... f son primos relativos. exis- 
ten polinomios g; con coeficientes en el cuerpo de los escalares tales que 


(9-16) 1= 2495 
1 


Indicamos brevemente cómo se pueden construir estos g,. Si p; = X — cy. 
entonces f;(c¡) 4 0, y para g; se toma el polinomio escalar 1, file; T Si todo 
polinomio es de esta forma, los f;g; son la familia de los os e Lagrange 
asociados con los ¢4, . . . , Ck, y (9-16) es claramente válida. Supóngase que algún 
P; = (x — cíx — E) con ¢ un número complejo no real. Entonces V es un 
espacio producto interno real, y se tiene 

0, E 


9 = HT 


8 s 


donde s = (c — č)f;(c). Entonces 


— (s +8)z — (cs + ēs) 


con lo que gj; es un polinomio con coeficientes reales. Si p es de grado n. en- 
tonces 


m Z fsi 


es un polinomio con coeficientes reales de grado n — 1 a lo más; además. se 
anula en cada una de las n raíces (complejas) de p’ y. por tanto, es idéntica- 
mente 0. 

Sea ahora x un vector arbitrario de V. Entonces. por (9-16) 


AT 2 (Da Da 


y como p(T)f¡(T) = 0, se sigue que f(T)g¡(T)x está en W; para cada j. Por 
el Lema 4, W; es ortogonal a W; siempre que i + j. Por tanto, V cs la suma di- 
recta ortogonal de W,..... W,. Si B es cualquier vector en W. ¡+ Entonces 


PAT)TB = Tp(T)8 = 0; 


así que W; es invariante por T. Sea T, la restricción de Ta W;. Entonces p;(T,)=0. 
con lo que p; es divisible por el polinomio minimal para Ta Como p; es irreduz 
cible sobre el cuerpo de los escalares, se sigue que pj es el polinomio minimal 
para T;. 

Sea. ahora e; = fig; y Ej = e;(T). Entonces para todo vector x de V Ex 
está en W, y 7 
=. Y Eja. 

i 


Asi, a — Eia = 2, Eja; como W; es ortogonal a W, si j = i. esto implica que 
jži 


x — Ex está en W;*. Se deduce ahora. del Teorema 4 del Capitulo 8. que E, us 
la proyección ortogonal de Y sobre W,. I 


Definición. Los subespacios W; (1 < j < k) se llaman componentes primos 
de V según T. 


producto interno 


Corolario. Sean T un operador normal sobre un espacio producto interno 
de dimensión finita V y W,, . . - , W, los componentes primos de V según T. Supón- 
gase que W es un subespacio de V invariante por T. Entonces 


W=I WOW. 
j 


Demostración. Evidentemente W contiene a 2 W M W;. Por otro lado, 


J 
W, que es invariante por T, es invariante por todo polinomio de T. En particu- 
lar, W es invariante por la proyección ortogonal E, de V sobre W;. Si a está en 
W, se sigue que Eja está en W N W, y, al mismo tiempo, que a = 2 Eja. Por 
i 


tanto, W está contenido en E WAN W, | 
j 


El Teorema 17 muestra que todo operador normal T sobre un espacio pro- 
ducto interno de dimensión finita está dado canónicamente por un número 
finito de operadores normales 7, definidos sobre los componentes primos W de 
V según T, cada uno de cuyos polinomios minimales es irreducible sobre el 
cuerpo de los escalares. Para completar el conocimiento de los operadores 
normales es necesario estudiar operadores normales de este tipo especial. 

Un operador normal cuyo polinomio minimal es de grado 1 es obviamente 
apenas un múltiplo escalar de la identidad. Por otro lado, cuando el polinomio 
minimal es irreducible y de grado 2, la situación es más complicada. 


Ejemplo 1. Supóngase que r > 0 y que O sea un número real no múltiplo 
entero de z. Sea T el operador lineal sobre R? cuya matriz en la base ortonormal 


canónica es 
ta E 0 —senG 
sen 0 cos O, 


Entonces T es un múltiplo escalar de una transformación ortogonal y, por 
tanto, normal. Sea p el polinomio propio de T, entonces 


p = det (zI — A) 
(x — r cos 0)? + r? sen? 0 
= x — Êr cos 0x + r? 


Sea a = r cos O, b = rsen U y ¢ = a + ib. Entonces b + 0, c = re” 


a —b 
Ag i “i 
yp = (x — olx — č). Luego p es irreducible sobre R. Como p es divisible por 


el polinomio minimal de T, se sigue que p es el polinomio minimal. 
Este ejemplo sugiere el siguiente recíproco. 


Teorema 18. Seun T un operador normal sobre un espacio producto interno 
real de dimensión finita V y p su polinomio minimal. Supóngase que 


= (x — a? + b? 


donde ay b son reales y b 4 0. Entonces existe un entero s > 0 tal que j" es el 
polinomio propio de T y existen subespacios V}, ..., V, de V tales que 
G) V; es ortogonal a V, cuando i Ads 
CACA i 
Gii) cada V, tiene una base ortonormal {a;, B;} con la propiedad de que 
Ta; = a0, + bf, 
Tp, = —ba, + af. 
En otras palabras, si r = ,/a? + b? y 0 se elige de modo que u = r cos 0. 


y b = rsen 0, entonces V es una suma directa ortonormal de espacios bidi- 


mensionales V; en cada uno de los cuales T actúa como «r veces la rotación 
de ángulo 0». 


La demostración del Teorema 18 estará basada en el siguiente resultado. 


Lema. Sean ls un espacio producto interno real y S un operador normal 
sobre V tal que S? + I= 0. Sea a cualquier vector de V y B = Su. Entonces 


Su = — 
(9-17) A £ 
SHa 
(2/$) = 0, y ljal] = (1811. 
Demostración. Tenemos que Sa = P y SP = S?%u = —a. Por tanto. 
0 = [Sa — fill? + 1158 + all? = |/Sal]? — 2(Sa]8) + liell? 
+ IISI? + 2(Spla) + llall. 
Como S es normal, se sigue que 
0 = [[S*all? — 2(S*Bla) + IIBII? + |1S*gI|? + 2(5*a/6) + Ilall? 
= [Sta + gll? + 11*8 — all? 
Esto implica (9-17); luego 
(a6) = (S*6lB) = (6/58) ` 
l-a) 
— (al8) 


ll 


y (af) = 0. En forma análoga 
llall? = (S*gla) = (8|Sa) = Jl6ll. E 


Demostración del Teorema 18. Sea V,, ..., V, una colección maximal 


de aia bidimensionales que satisfacen (i) y (ii) y las condiciones adi- 
cionales 


T*a, = aaj — dB, 
(9-18) p 1<j<s. 
T*B; = ba; + aß; 


Sea W = V, +--- + V, Entonces W es la suma directa ortogonal de los 


Operaden producto interno 


Vi. ..., V,- Veremos que W = V. Supóngase que éste no sea el caso. Enton- 
ces W+ + (0). Más aún, como (iii) y (9-18) implican que W es invariante por 
T y T*, se sigue que W+ es invariante por T* y T = T**. Sea S = b` '(T— al). 
Entonces S* = b` UT* — al), S*S = SS* y W* es invariante por S y S*. 
Como (T.— al? + b?I = 0. se sigue que S? + I= 0. Sea a cualquier vector 


de norma l en W* y sea f = Sa. Entonces f está en W* y Sf = —a. Como 
T = al = bS, esto implica que 

Ta = aa + bg 

TB = —ba + aß. 


Por el teorema, Sta = — f, S*B = a. (ajf) = 0 y ||$]| = 1. Ya que T* = al + 
bS*, se sigue que 


T*a = aa — dB 
T*B = ba + aß. 
Pero esto contradice el hecho de que V,, ..., V, es una colección maximal de 


subespacios que satisfacen (i), (iii) y (9-18). Por tanto, W = V, y como 
ra b ¡Don Ar AA a 
der| En Del = (1 — a)? +b 
se sigue de (i), (ii) y (iii) que 
det (z7 — T) = [(2— a)? + b}. D 
Corolario. En las condiciones del teorema, T es inversible y 


T* = (a? +b). 
Demostración. Como 


k zaf a delar 0 ] 

b all—b al 0 a? + b? 

se sigue de (iii) y (9-18) que TT* = (a? + b?)1. Luego T es inversible y T* = 
AN | 


Teorema 19. Sea T un operador normal sobre un espacio producto interno 
de dimensión finita V. Entonces cualquier operador lineal que conmuta con T 
también conmuta con T*. Además, todo subespacio invariante por T es también 
invariante por T*. 

Demostración. Supóngase que U es un operador lineal sobre V que con- 
muta con T. Sea E; la proyección ortogonal de Y sobre el componente primo 
W; (1 < j < k) de V según T. Entonces E; es un polinomio en T y, por tanto, 
conmuta con U. Así que 


E¡UE, = UE] = UE). 
con lo que U(W;) es un subconjunto de W,. Sean T; y U; las restricciones de 


T y U a W,. Supóngase que 1; es el operador identidad sobre W,. Entonces U; 
conmuta con 7,, y si T} = cf; es claro que U; también conmuta con Tř = Ej. 


Algebra 


Por otro lado, si T; no es un múltiplo escalar de 1,, entonces T; es inversible y 
existen números reales a; y b; tales que 


T$ = (af + )T; 
Como U;T; = T,U, se sigue que T; 'U, = U,T, *. Por tanto, U; conmuta con 


Tř en ambos casos. Ahora T* también. conmuta con E; y, por tanto, W; es in- 
Variante por T*. Además. para todo x y ß de W, 


(Tial) = (Talb) = (a]T*8) = (al T36). 


Como T*(W,) está contenido en W,, esto implica que TF es la restricción de 
T* a W; Aši que 


UT*a; = T*Ua; 
para todo a, de W,. Como V es la suma de W,, 
UT*a = T*Ua 


para todo a de V y, por tanto, que U conmuta con T*. 
Supóngase ahora que W es un subespacio de V invariante por T y sea Z;¡= 
W N Wj. Por el corolario del Teorema 17, W = > Z;. Así que es suficiente 


, Wp» se sigue que 


demostrar que todo Zj es invariante por TF. Esto es “obvio si T) = CI. Cuando 
éste no es el caso, T; es inversible y aplica Z; en, y en consecuencia sobre, Zi. 
Así, T; '(Z;) = Z; y como 


= (a + b)Tr' 
se concluye que T*(Z,) está contenido en Zj, para todo j. | 


Supóngase que 7 es un operador normal en un espacio producto interno 
de dimensión finita V. Sea W un subespacio invariante por T. Entonces el co- 
rolario anterior muestra que W es invariante por 7*. De esto se sigue que Wt 
es invariante por 7** = T (y, en consecuencia, también invariante por T*). 
Usando este hecho se puede fácilmente demostrar la siguiente versión más 
reforzada del teorema de descomposición cíclica, dado en el Capítulo 7. 


Teorema 20. Sea T un operador lineal normal en un espacio producto in- 
terno de dimensión finita V (dim V > 1). Entonces existen r vectores no nulos 
Xis -3% en V con los respectivos T-anuladores e,, ..., e, tales que 


ü) V= Zæ: T)®--- @® Zla; T); 
(li) si 1 <k <r- 1. entonces eyy, divide a ep; 
üii) Z(«j; T) es ortogonal a Z(%,; T) si j+ k. Además, el entero r y los 
anuladores e,, <.. , e, están univocamente determinados por las condiciones (i) y 
(ii) y por el hecho de que ningún 2, es 0. 


Corolario. Si A es una matriz normal de elementos reales (complejos), en- 
tonces existe una matriz real ortogonal (unitaria) P tal que P=LAP está en forma 
canónica racional. 


Se sigue que dos matrices A y B son equivalentes unitariamente si, y solo si, 
tienen la misma forma racional; A y B son equivalentes ortogonalmente si 
tienen elementos reales y la misma forma racional. 

Por otro lado, hay un criterio más simple que la equivalencia unitaria de 
las matrices normales y los operadores normales. 


Definiciones. Sean V y V’ espacios producto interno sobre el mismo cuerpo. 
Una transformación lineal 
U:V=>Vv' 
se dice una transformación unitaria si aplica V sobre V' y preserva los productos 
internos. Si T es un operador lineal sobre V y T’ un operador lineal sobre V’, en- 
tonces T es unitariamente equivalente « 7”, si existe una transformación unitaria 
U de V sobre V’ tal que 
UTU! =T". 

Lema. Sean V y V' espacios producto interno de dimensión finita sobre el 
mismo cuerpo. Supóngase que T es un operador lineal sobre V y que T" es un ope- 
rador lineal sobre V’. Entonces T es unitariamente equivalente a T' si, y solo si, 
existen una base ortonormal @ de V y una base ortonormal @' de V’ tal que 


[T]e = [T ]e 
Demostración. Supóngase que hay una transformación unitaria U de V 
sobre V” tal que UTU`' = T'. Sea @ = fxi, ..., %,) cualquier base (orde- 
nada) ortonormal de V. Sca x; = Ug; (1 < j < n)- Entonces @' = (%....,%,) 
es una base ortonormal de V’; y haciendo 
n 
Taj= Y Ajak 


se ve que 
T'o; = UTa; 


Luego [7]g = 4 = [T lg- 

Recíprocamente, supóngase que existen una base ortonormal @ de V y una 
base ortonormal (3 de V’ tales que 

[Pla = [T] 
y sea A = [T]g. Supóngase que G = [%1....., %) y que @' = (%..... LA 
Sea U una transformación lineal de V en V tal que Ux; ="2,(1 < j < n). Enton- 
ces U es una transformación unitaria de V sobre V”, y 
UTU'a; = UTa, 
= U Ð Asja 
k 


= E Arak. 
k 


Por tanto, UTU” la; = Ta (1 < j < m), y esto implica que UTU"! = 7". I 


Se sigue inmediatamente de este lema que los operadores unitariamente 
equivalentes en espacios de dimensión finita tienen el mismo polinomio propio. 
Para operadores normales el recíproco es válido. 

Teorema 21. Sean V y V' espacios producto interno de dimensión finita 
sobre el mismo cuerpo. Supóngase que T es un operador normal sobre V y que 
T' es un operador normal sobre V'. Entonces T es unitariamente equivalente a T' 
si, y solo si, T y T’ tienen el mismo polinomio propio. 


Demostración. Supóngase que T y T' tienen el mismo polinomio propio f. 
Sean W; (1 < j < k) los componentes primos de V según T y T; la restricción 
de Ta W;. Supóngase que /; sea el operador identidad sobre W;. Entonces 


k 
f= E det (21, — T). 
= 
Sea p; el polinomio minimal de 7). Si p; = x — c; es evidente que 


det (zI; — T;) = (x= 6)" 


donde s; es la dimensión de W;. Por otro lado, si p; = (x — a)? -+ b? con a. b; 
reales y b; + 0, entonces se sigue del Teorema 18 que 


det (+1, — T;) = p 
donde en este caso 2s; es la dimensión de W),. Por consiguiente, f = TI p}. 


Se puede ahora calcular también f por el mismo método usando los compo- 
nentes primos de V’ según T’. Como pj, . . -, Px son primos distintos, se sigue 
de la unicidad de la factorización prima de f que hay exactamente k componentes 
primos Wj; (1 < j < k) de V’ según T” y que éstos pueden ser rotulados con 
índices de tal modo que p; sea el polinomio minimal de la restricción T; de T’ a 
Wj. Si p= x — cj, entonces T; = cjl; y Tj = C;l;, donde I; es el operador 
identidad sobre Wj. En este caso es evidente que T; es unitariamente equivalente 
a Tj. Si pj = (x — aj) + b3, como anteriormente, entonces por el lema y el 
Teorema 20, tenemos nuevamente que T; es unitariamente equivalente a Tj. 
Así, pues, para todo j existen bases ortonormales G, y @; de W, y Wj, respec- 
tivamente, tales que 


[T Je, = [Te 


Sea ahora U la transformación lineal de Y en Y” que aplica cada (3, sobre Bj. 
Entonces U es una transformación unitaria de V sobre V' tal que UTU * = T’. | 


10. Formas bilineales 


10.1. Formas bilineales 


En este capítulo se tratará de las formas bilineales sobre espacios vectoriales 
de dimensión finita. El lector observará probablemente una analogía entre 
cierto material y el estudio de los determinantes del Capítulo 5 y de los productos 
internos y de las formas en los Capítulos 8 y 9. La relación entre formas bili- 
neales y productos internos es particularmente estrecha; sin embargo, este 
capítulo no presupone ningún material de los Capítulos 8 0 9. Al lector que 
no esté familiarizado con los productos internos le será provechoso leer la pri- 
mera parte del Capítulo 8 al tiempo que se adentra en el estudio de las formas 
bilincales. 

La primera sección trata del espacio de las formas bilineales sobre un espa- 
cio vectorial de dimensión n. Se introduce la matriz de una forma bilineal en 
una base ordenada y se establece el isomorfismo entre el espacio de las formas 
y el espacio de las matrices n x n. Se define el rango de una forma bilineal y 
se introducen las formas bilineales no degeneradas. La segunda sección estudia 
las formas bilineales simétricas y su diagonalización. La tercera trata las formas 
bilineales antisimétricas. La cuarta estudia el grupo que preserva una forma 
bilineal no degenerada, con especial atención a los grupos ortogonales, a los 
grupos seudoortogonales y a un grupo seudoortogonal particular -~el grupo 
de Lorentz. 


Definición. Sea V un espacio vectorial sobre el cuerpo F. Una forma bilineal 
sobre V es una función f que asigna a cada par ordenado de vectores a, B de V un 
escalar fía, B) de F, y que satisface 
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(10-1) fica, + 2%. B) = cfai B) + faz. B 
Ha. cf, + Pa) = cha. Br) + fo. Pa). 


Si F x V es el conjunto de todos los pares ordenados de vectores de V, 
esta definición puede expresarse como sigue: una forma bilineal sobre Y es una 
función f de V x V en F que es lineal como función de uno de sus argumentos 
cuando el otro se deja fijo. La función cero de Y x V en T es obviamente una 
forma bilincal. También es cierto que cualquier combinación lineal de formas 
bilineales sobre V es una forma bilincal. Para demostrarlo es suficiente consi- 
derar combinaciones lineales del tipo cf + g, donde f y g son formas bilineales 
sobre V. La demostración de que cf + g satisface (10-1) es similar a muchas 
otras que se han dado, y por tal razón se omitirá. Todo esto puede resumirse 
diciendo que el conjunto de todas las formas bilineales sobre Y es un subes- 
pacio del espacio de todas las funciones de V x V en F (Ejemplo 3, Capítulo 2). 
Se representará el espacio de las formas bilineales sobre Y por LIV, V, F). 


Ejemplo 1. Sea V un espacio vectorial sobre el cuerpo F y sean L, y Lz 
formas bilineales en V. Se define f por 


Ja, B) = Lila) L(B). 


Si se fija f$ y se considera a f como función de a, entonces se tiene simplemente 
un múltiplo escalar del funcional lineal L,. Con a fijo, f es un múltiplo escalar 
de L),. Así es claro que f es una forma bilincal en V. 


Ejemplo 2. Sean m y n enteros positivos y F un cuerpo. Sea V el espacio 
vectorial de las matrices m x n sobre F. Sea A una matriz m x m dada sobre F. 
Se define 

Ja(X, Y) = tr (X'AY). 


Entonces f4 es una forma bilineal sobre V. En efecto, si X, Y y Z son matrices 
m x n sobre F 


SaleX + Z, Y) = tr [(cX + Z)AY] 
tr (cXLAY) + tr (Z'AY) 
falX, Y) + falZ, Y). 


Desde luego, se ha hecho uso de que la operación transpuesta y la función traza 
son lineales. Es incluso más fácil demostrar que f, es lineal como función de 
su segundo argumento. En el caso especial n = 1, la matriz X'AY es 1 x 1. 
es decir, un escalar, y la forma bilineal es solamente 


fa(X, Y) = X'AY 
= 22 Astur 
y 4 


Mostraremos ahora que toda forma bilineal sobre el espacio de las matrices 
m x l es de este tipo; es decir, es f, para cierta matriz m x m, A. 


Ejemplo 3. Sea F un cuerpo. Queremos hallar todas las formas bilineales 
sobre el espacio F?. Supóngase que f sea una forma bilineal de este tipo. Si 
x = (xi, X2) y B = (ys, Y2) son vectores de F?, entonces 


fla, b) = fía + me, B) 
= af (a, B) + Taf (es B) 
= Tifla, Ye + Y) + Tf (é, Ya + Y262) 
= aula, €) + yla, e) + Tayf len e) + tf len e2). 


Así f está completamente determinada por los cuatro escalares A,; = f(€;, €) por 
fla, PB) = Antiy + Anta + Antes + Anta 
= 2 Aity 
. 


Si X e Y son las matrices de coordenadas de « y £ y si A es la matriz 2 x 2 con 
los elementos A(i,j) = Aij = J(€¡, €), entonces 


(10-2) fa, bB) = X'AY. 


Se observó en el Ejemplo 2 que si A es cualquier matriz 2 x 2 sobre F, enton- 
ces (10-2) define una forma bilineal sobre F?. Se ve que las formas bilineales 
sobre F? son precisamente las que se obtienen de una matriz 2 x 2 como 
en (10-2). 

El análisis del Ejemplo 3 puede generalizarse para describir todas las formas bi- 
lineales sobre un espacio vectorial de dimensión finita. Sea V un espacio vec- 
torial de dimensión finita sobre el cuerpo F y sea @ = (a,,..., a.) una base 
ordenada de V. Supóngase que f es una forma bilineal en V. Si 


a= qa +. Hna y B= t e H Ynn 


son vectores en V, entonces 
Fa, PB) =f e Tiati B) 
= Z rifle; P) 
=2 zf (es z vias) 
= X E 144 lan 05). 
dnd 
Si se hace 4;j = f(%, 0), entonces 
fa, B) = È R Aity 
i j 
= MAY 


donde X e Y son las matrices de coordenadas de a y $ en la base ordenada @. 
Así toda forma bilineal en V es del tipo 


(103) Fo, 6) = [ale A [Bla 


-r 
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para alguna matriz n x n sobre F. Reciprocamente, si se tiene cualquier ma- 
triz n x n, A, es fácil ver que (10-3) define una forma bilineal f sobre V, tal 
que Aij = flan 2). 


Definición. Sea V un espacio vectorial de dimensión finita YSCON= la, 138 
ðn} una base ordenada de V. Si f es una forma bilineal sobre V, la matriz de f en 
la base ordenada Ĝ es la matriz n x n, A, con elementos A; y = Ha, 2). A veces 
se representará esta matriz por | f la: 


Teorema 1. Sea V un espacio vectorial de dimensión finita sobre el cuer- 
po F. Para cada base ordenada @ de V, la función que asocia a cada forma bi- 
lineal sobre V su matriz en la base ordenada GB es un isomorfismo del espacio 
L(V, V, F) sobre el espucio de las matrices n x n sobre el cuerpo F. 


Demostración. Se observó anteriormente que f—>[flg es una corres- 
pondencia biunívoca entre el conjunto de las formas bilineales sobre Y y el 
conjunto de todas las matrices n x n sobre F. Que es una transformación lineal 
es fácil de ver, ya que 

($ + Días, a) = eflas, a) + glan a) 
para todo i y j. Esto simplemente dice que 


[S + gls = cl fu + [gla. p 


Corolario. SiB= [a,,...,0,) es una base ordenada de V y @* = ! L... 
Laj es la base dual de V*, entonces las n? formas bilincales 
ES h= L(o)L,(B), 
Jorman una base del espacio L(V, V, F). En particular, la dimensión de 
L(V, V, F) es n. 


Demostración. La base dual {Lis ..., La} está esencialmente definida 
por el hecho de que L;(a) es la ¿-ésima coordenada de x en la base ordenada @ 
(para todo a de V). Ahora bien, las funciones Jij; definidas por 

fila, B) = L(o)L,(B) 


son formas bilineales del tipo considerado en el Ejemplo 1. Si 


l<si<n 1l<j<n 


a = tont hE man y B = pa + -+-- + Ynn 
entonces 


Jula, B) = x.y). 


Sea f cualquier forma bilineal sobre Y y sea A la matriz de f en la base or- 
denada (3. Entonces 


Fa, b) = È Azry 
aJ 


que simplemente dice que 
J= ZA 
tJ 
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Está ahora claro que las n? formas Jy constituyen una base de L(V, V, F). |] 


La demostración anterior se puede expresar de otra manera como sigue. 
La forma bilineal f;, tiene por matriz en la base ordenada GB la matriz «uni- 
taria» E>}, cuyo único elemento no nulo es un 1 en la fila į y la columna j. Como 
estas matrices unitarias constituyen una base del espacio de las matrices n x n, 
las formas f;; constituyen una base del espacio de las formas bilineales. 

El concepto de matriz de una forma bilineal en una base ordenada es análo- 
go al de matriz de un operador lineal en una base ordenada. Al igual que para 
los operadores lineales, estamos interesados en qué le sucede a la matriz re- 
presentante de una forma bilineal cuando se pasa de una base ordenada a otra. 
Para ello. supóngase que @ = ([2,,...,a,) y BH = fais ..., a) sean dos bases 
ordenadas para V y que f sea una forma bilineal en V. ¿Cómo están relacio- 
nadas las matrices Ufa y LJe? Sca P la matriz n x n (inversible) tal que 


lala = Pladur 
para todo x en V. En otras palabras. se define P por 
n 
ary Piai. 


Para vectores x, fí cualesquiera en V 


Sa, B) = [als Lells 

Plalw) [S]e P 18] 

[alw PeP) [B]e 

Por la definición y unicidad de la matriz representante de f en la base orde- 
nada @', debemos tener que 


(104) Flw = Pfa. 


ll 


Ejemplo 4. Sea V el espacio vectorial R?. Sea f la forma bilineal definida 
por æ = (xi, X2) y P = (xi. ¥2) por 


Aboa Sla, B) = 09 + tiye + e H teya 


fia, B) = Lar, 12] Li 1 sd 


y así la matriz de f en la base ordenada canónica @ = (€1, €2) €s 


(so =[, i} 


Sea (B' = jej, €) la base ordenada definida por €, = (1. —1) € = (1, 1). 
En este caso, la matriz P que cambia las coordenadas de @' a GB es 


in 1 17 
mefa, 4 


A A A A. SA ct tias 
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Así 
[fa = P:[faP 


eG 
-e 3) 
-E3 


Esto quiere decir que si se expresan los vectores « y $ por medio de sus coorde- 
nadas en la base 63”, por ejemplo, 


a = tia Ht, B= yid + ye 
entonces d 
Fla, B) = 4azyz. 


Una consecuencia de la fórmula (10-4) para el cambio de base es la siguien- 
te: si Ay B son matrices n x n que representan la misma forma bilineal sobre 
V en bases ordenadas (posiblemente) diferentes, entonces A y B tienen el mismo 
rango. En efecto, si P es una matriz n x n inversible y B = P'AP, es evidente 
que 4 y B tienen el mismo rango. Esto hace posible definir el rango de una forma 
bilineal«en Y como el rango de cualquier matriz que represente la forma en una 
base ordenada para V. 

Es deseable dar una definición más intrínseca del rango de una forma bi- 
lineal. Esto se. puede hacer del siguiente modo. Supóngase que f es una forma 
bilineal sobre el espacio vectorial V. Si se fija un vector a de Y, entonces fa, p) 
es lineal como función de f. De este modo cada a fijo determina un funcional 
lineal en V,; se representa esta función lineal por L;(«). Repitiendo, si æ es un 
vector en Y, entonces £,(a) es el funcional lineal en Y cuyo valor para cualquier 
vector f es fía, p). Esto da una transformación a => L;(a) de V en el espacio 
dual V*. Como 


ficar + 02, B) = efla, B) + Fla, B) 
vemos que 
Li(cor + a) = cLy(01) + Lila) 


esto es, L; es una transformación lineal de V en V*. 

De modo semejante, f determina una transformación lineal Ry de V en V*, 
Para cada £ fijo en V, fa, P) es lineal como función de a. Se define Rp) como 
el funcional lineal sobre Y cuyo valor para el vector « es fía, p). 


Teorema 2. Sea f una forma bilineal sobre el espacio vectorial de dimensión 
finita V. Sean L; y Ry las transformaciones lineales de V en V* definidas por 
(LjaMB) = fla, P) = (RyPMa). Entonces, rango (Ly) = rango (Rp). 


Demostración. Se puede dar una demostración de este teorema que no 
dependa de las coordenadas. Tal demostración es parecida a la demostración 
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de que el rango de fila de una matriz es igual al rango de columna (Sección 3.7). 
Así que se dará aquí una demostración que consiste en elegir un sistema de 
coordenadas (base) y entonces usar el teorema de «rango de fila igual a rango 
de columna». 

Para demostrar que rango (L;) = rango (R;) es suficiente demostrar que 
Lpy Rs tienen la misma nulidad. Sea @ una base ordenada para V y sea A = LA: 
Si a y ß son vectores en V, con matrices de coordenadas X e Y en la base orde- 
nada (3, entonces f(«, $) = X'AY. Ahora, RAB) = 0 quiere decir que fla, fB)=0 
para todo a en V, es decir, que X'4Y = 0 para toda matriz n x 1, X. Esta úl- 
tima condición dice que AY = 0. La nulidad de R; es, por tanto, igual a la 
dimensión del espacio solución de AY = 0. 

Similarmente, Ly(«) = 0 si, y solo si, X'AY = 0 para toda matriz n x 1, Y. 
Así a está en el espacio nulo de L, si, y solo si, X'A = 0 es decir, 4'X = 0. La 
nulidad de L; es, por tanto, igual a la dimensión del espacio solución de AX = 0. 
Como las matrices A y A" tienen el mismo rango columna, vemos que 


nulidad (L,) = nulidad (Ry). f 


Definición. Si f es una forma bilineal sobre un espacio de dimensión finita 
V, el rango de f es el entero r = rango (Ls) = rango (R)). 


Corolario 1. El rango de una forma bilineal es igual al rango de la matriz 
de la forma en cualquier base ordenada. 


Corolario 2. Si f es una forma. bilineal sobre el espacio vectorial de di- 
mensión n, lo siguiente es equivalente: 


(a) Rango (f) = n. 3 
(b) Para todo au no nulo de V, existe un B en V tal que fía, p) + 0. 
(c) Para todo B no nulo de V, existe un a en V tal que fa, p) + 0. 


Demostración. La afirmación (b) no dice más que el espacio nulo de L y es 
el subespacio cero. La afirmación (c) dice que el espacio nulo de R; es el sub- 
espacio cero. Las transformaciones lineales Ls y R; tienen nulidad 0 si, y solo si, 
tienen rango n, es decir, si, y solo si, rango (f)= n. Pl 


Definición. Una forma bilineal f sobre un espacio vectorial V se llema no 
degenerada (o no singular) si satisface las condiciones (b) y (c) del Corolario 2. 


Si V es de dimensión finita, entonces f es no degenerada siempre que f cumpla 
una cualquiera de las tres condiciones del Corolario 2. En particular, f es no 
degenerada (no singular) si, y solo si, su matriz en alguna (toda) base ordenada 
para V es una matriz no singular. 


Ejemplo 5. Sea Y = R”-y sea f la forma bilineal definida paraa = (x,,..., 
Xn) Y B= (Yis -- -> Ya) por 


Fla, B) = YN + +-- + Eryn 


E ae oa 
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Entonces / es una forma bilineal no degenerada en R”. La matriz de f en la 
base ordenada canónica es la matriz unidad n x n 


KX, Y) = X'Y. 


Este / generalmente se llama producto escalar. El lector estará probablemente 
tamiliarizado con esta forma bilineal. al menos para el caso n = 3. Geomé- 
tricamente el número f(a, £) es el producto de la longitud de x, la longitud de 
B y el coseno del ángulo entre x y $. En particular f(a, B) = 0 si. y solo si, los 
vectores a y j son ortogonales (perpendiculares). 


Ejercicios 


l. ¿Cuáles de las siguientes funciones / definidas para vectores x = (xi x2)y P = Iris 13) 
de R? son formas bilincales? 

(a) Sa, p) = 1. 

(b) Sla, Bi = (21 — 1)? + tio 

(© fla, B) = (+ y)? — (a — y)? 

(d) fla, B) = 2142 — ron. 


2. Sca / la forma bilineal sobre R? definida por 


Few Ya), (£2, Y)) = 00 + Laa. 
Hallar la matriz de f en cada una de las siguientes bases 
(10,00) O 0,1), 0, Dh (02,867. 


3. Sca V el espacio de todas las matrices 2 x 3 sobre R y sea f la forma bilincal sobre 
V definida por f(X, Y) = traza (X"4Y). donde 


yy 2 
= p 
E 4 
Hallar la matriz de f cn la base ordenada 
En, E”, EM, En, ER, En; 
donde E" es la matriz cuyo único elemento no nulo es un 1 en la fila i y columna j. 


4. Describir explícitamente todas las formas bilineales f sobre R* con la propiedad de 
que fía, P) = fP. a) para todo x, f. 


5. Describir la forma bilineal sobre R? que satisface fla. f) = — HB. x) para todo x. B. 


6. Sea n un entero positivo y sea V el espacio de todas las matrices # x 1 sobre el cuerpo 
de los números complejos. Demostrar que 


SCA, B) = n tr (AB) — tr (A) tr (B) 
define una forma bilineal f sobre V. ¿Es verdad que f(4, B) = /(B. A) para toda A. B? 


7. Sea f la forma bilineal definida en el Ejercicio 6. Demostrar que f es degencrada (que 
no es no degenerada). Sea V, el subespacio de V que consiste en las matrices de traza 0. y 
sea fı la restricción de f a V,. Mostrar que f, es no degenerada. 


8. Sca f la forma bilineal definida en el Ejercicio 6 y sea V; el subespacio de V que consis- 


S.A AEREA ii O R 
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te en todas las matrices A tal que traza (4) = 0 y A*= —A (A* es la transpuesta conju- 
gada de 4). Desígnese por f, la restricción de f a V,. Mostrar que Ja es negativamente de- 
finida; es decir. que f,(4. 4) < 0 para cada A no nulo en V,. 

9. Sea f la forma bilineal definida en el Ejercicio 6. Sea W el conjunto de todas las matri- 
ces A en Y tales que f(4. B} = 0 para todo B. Demostrar que W es un subespacio de Y. 
Describir W explícitamente y hallar su dimensión. 

10. Sca f cualquier forma bilineal sobre un espacio vectorial de dimensión finita V. Sea 
W el subespacio de todos los ff tales que fla, $) = 0 para todo a. Mostrar que 


rango f = dim V — dim W. 


Usar este resultado y el del Ejercicio 9 para calcular el rango de la forma bilineal defini- 
da en el Ejercicio 6. 


Ml. Sea f una forma bilineal sobre un espacio vectorial de dimensión finita V. Supón- 
gase que V, es un subespacio de V con la propiedad de que la restricción -de fa V, es no 
degenerada. Demostrar que rango f > dim Y. 
12. Scan f, g formas bilineales sobre un espacio vectorial de dimensión finita V. Supón- 
gase que g es no singular. Demostrar que existen operadores lineales únicos 7,, T, sobre 
V tales que 

Sa, B) = (Tia, B) = g(a, T38) 
para todo a, ß. 
13. Demostrar que el resultado dado en el Ejercicio 12 no necesita ser cierto si g es 
singular. 
14. Sea f una forma bilineal sobre un espacio vectorial de dimensión finita V. Demos- 


trar que f puede expresarse como producto de dos funcionales lineales (es decir, Fa, p) = 
Li(œ)La($) para Li, L} en V*) si, y solo si, f tiene rango I. 


10.2. Formas bilineales simétricas 


El propósito principal de esta sección es responder a la siguiente pregunta: 
si f es una forma bilineal sobre el espacio vectorial de dimensión finita V, ¿cuán- 
do existe una base ordenada GB de V en la que f esté representada por una matriz 
diagonal? Se demostrará que esto es posible si, y solo si, f es una forma bilinea] 
simétrica, es decir, fía. f) = KB, a). El teorema se demostrará solo cuando 
el cuerpo de los escalares tiene característica cero, esto es, que si es un entero 
positivo la suma 1 + 1+---+1 (n sumandos) en F no es 0. 


Definición. Sea f una forma bilineal sobre el espacio vectorial V. Se dice 
que f es simétrica si fía, $) = f(f, a) para todos los vectores a, f de V. 


Si V es de dimensión finita, la forma bilineal f es simétrica si, y solo si, su 
matriz A en cierta (o en toda) base ordenada es simétrica, 4' = A. Para ver 
esto se requiere saber cuándo la forma bilineal 


FX, Y) = X'4Y 


q PER IIA A 
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es simétrica. Esto sucede si, y solo si, X'4Y = Y!AX para todas las matri 
columnas X e Y. Como X'4Y es una matriz 1 x 1, se tiene que X'AY = Y'A‘ 
Así, pues, f es simétrica si, y solo si, Y'A'X¥ = Y'AX para todo X, Y. Evident 
mente esto quiere decir que A = 4". En particular, debe observarse que si exis 
una base ordenada para V en la que f está representada por una matriz diag 
nal, entonces f es simétrica, ya que cualquier matriz diagonal es una matri 
simétrica. 

Si f es una forma bilineal simétrica, la forma cuadrática asociada con Fes 
la función q de V en F definida por 


gla) = fa, a). 


Si F es un subconjunto de los números complejos, la forma bilincal simétrica 
está completamente determinada por su forma cuadrática asociada, de acuer- 
do con la identidad de polarización 
(10-5) Ja, B) = igla + B) — igla — B). 
El establecer (10-5) no es más que una rutina de.cálculo que se omite. Si fesla 
forma bilincal del Ejemplo 5, el producto escalar, la forma cuadrática aso- 
ciada es 

Qlan- -p En) = A H + 


En otras palabras, g(a) es el cuadrado de la longitud de a. Para la forma bilineal 
Ja(X, Y) = X'AY, la forma cuadrática asociada es 
qa(X) = X'AX = ZA ¡oy 
ij 

Una clase importante de formas bilineales simétricas son los productos 
internos en los espacios vectoriales reales, estudiados en el Capitulo 8. Si V es 
un espacio vectorial real, un producto interno sobre V es una forma bilineal 
simétrica f sobre V tal que 


(10-6) fax) >0 si «#0. 


Una forma bilineal que cumple (10-6) se llama positivamente definida. Así, un 
producto interno sobre un espacio vectorial real es una forma bilineal simétrica 
y positivamente definida sobre ese espacio. Obsérvese que un producto interno 
es no degenerado. Dos vectores a, f se llaman ortogonales respecto al pro- 
ducto interno f si fía, p) = 0. La forma cuadrática q(x) = fla, a) toma solo 
valores no negativos y q(a) se considera corrientemente como el cuadrado de 
la longitud de a. Desde luego, estos conceptos de longitud y ortogonalidad 
tienen su origen en el más importante ejemplo de un producto interno —el 
producto escalar del Ejemplo 5. 

Si f es cualquier forma bilineal simétrica sobre un espacio vectorial V, es 
conveniente aplicar en parte la terminología a los productos internos a f. Es 
especialmente conveniente decir que a y f son ortogonales con respecto a fsi 
fia, P) = 0. No es aconsejable pensar en fa, a) como el cuadrado de la longi- 
tud de a; por ejemplo, si V es un espacio vectorial complejo, se puede tener 


Fa, a)=./—1, o en un espacio vectorial real, fa, «) = —2. 


Formas 


Se vuelve ahora al teorema básico de esta sección. Al leer la demostración, 
le será de provecho al lector pensar en el caso especial en que V es un espacio 
vectorial real y f un producto interno sobre V. 


Teorema 3. Sea V un espacio vectorial de dimensión finita sobre un cuerpo 
de característica cero, y sea f una forma bilineal simétrica sobre V. Entonces 
existe una base de V en la que f está representada por una matriz diagonal. 


Demostración. Lo que se debe hallar es una base ordenada 


, An} 

tal que f(a,. æj) = 0 para i + j. Sif=00n=1,el teorema es evidentem 
cierto. Por tanto, se puede suponer que f + 0 y n> 1. Si fa, a) F 0 para 
todo a.en V, la forma cuadrática asociada q es idénticamente 0 y la identidad 
de polarización (10-5) muestra que f = 0. Entonces existe un vector a en V tal 
que f(a, x) = qla) + 0. Sea W el subespacio unidimensional de V que es E 
rado por a y sea W+ el conjunto de todos los vectores Ben V tales que f(a, P) =0. 
Afirmamos que V = W @ W+. Ciertamente, los subespacios W y sá ee 
independientes. Un vector típico de W es ca, donde c es un escalar. Si también 
cx está en W+, entonces f(ca, ca) = fla, a) = 0. Pero fla, a) +0, 13 
e = 0. Así que cada vector de Y es suma de un vector de W y de un vector de W+. 
En efecto, sea y cualquier vector en V, y se hace 


G= (01,... 


Entonces 


Fa, B) = fía, Y) — fa a) AS a) 
y como f es simétrica, fu, PB) = 0. Así f está en el subespacio W+. La expresión 


fa, a) 
aa? 


muestra que V = W + W+. T an a 
La restricción de f a W* es una forma bilineal simétrica. Como W+ tiene 


dimensión (n — 1), suponer por inducción que W. tiene una base (07, ..., On} 
tal que , 
i#j(i2 2j 22). 


-> Qn} de V tal que fœ, aj) = 0 


Jas as) = 0, 
Haciendo a, = a, se obtiene una base {æ;, .. 
para i+j M 


Corolario. Sea F un subcuerpo de los números complejos, y sea A una ma- 
triz simétrica n x n sobre F. Entonces existe una matriz n X n inversible P sobre 
F tal que P'AP es diagonal. 


En caso de que F sea el cuerpo de los números reales, la matriz inwersible 
P de este corolario puede elegirse de modo que sea una matriz ortogonal, es 
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decir, #' = P~! 
existe una matri 
no es del todo 


- En otras palabras, si A es una matriz simétrica real 1 x n, 
Z ortogonal real P tal que P'AP es diagonal; sin. embargo, esto 
evidente en lo que se hizo anteriormente (véase Capitulo 8). 


Teorema 4. Sea Y un espacio vectorial de dimensión finita sobre el cuerpo 
de los números complejo. 


S. Sea f una forma bilineal simétrica sobre V que tiene 
rango r. Entonces existe una base ordenada B = (Bi, -.., Ba} de V tal que 


(i) la matriz de f en la base ordenada @ es diagonal; 
7 PGS 
GD ABr B) = le Pr 


, j>r. 


Demostración. Por el Teorema 3, existe una base ordenada 


Iiis conn an} 
de V tal que 


Sona) = 0 para ¡Aj 


Como f tiene rango r, también lo tendrá su matriz en la base ordenada ¡CA 
Entonces debemos tener que f(a;, a;) + 0 para r valores de j precisamente. Reor- 


denando los vectores A;, Se puede suponer que 


Ja; aj) 40, i=1L...,r 


Se usa ahora el hecho de que el cuerpo de los escalares es el cuerpo de los nú- 
meros complejos. Si Na, &;) representa cualquier raíz cuadrada compleja 
de fa, aj), y si se hace 
1 b 
Pr Vila, a) ® TELA E 


a, j>r 
la base {Bn ..., Pa} satisface las condiciones © y (ii). F 


Naturalmente, el Teorema 4 
quier subcuerpo de los números 
raíz cuadrada. No es válido, 
meros reales. Sobre el cuerpo 
tuto para el Teorema 4. 


es válido si el cuerpo de los escalares es cual- 
complejos en el que cada elemento tiene una 
cuando el cuerpo escalar es el cuerpo de los nú- 
de los números reales tenemos el siguiente susti- 


Teorema 5. Sea V un espacio de dimensión n sobre 
ros reales y sea f una forma bilineal simétrica sobre 
existe una base ordenada (Bi Bo, 
gúnal y tal que 


el cuerpo de los núme- 
V que tiene rango r. Entonces 
- -> Br) de V en la que la matriz de f es dia- 


IB P= E JE 2 


Además, el número de vectores de base 


P; para los que SBi B;) = 1 es indepen- 
diente de la elección de base. 
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Demostración. Existe una base Ífa,. .... ny de V tal que 
Fena) =0,  1%j 
Ja; aj) # 0, 1<j<r 
fa, a)=0, j>r. 


Sea > 
Bi = |faj a) a 1<jST 
B=0) J>T. 


Entonces (B,, ..., Pa} es una base con las propiedades poi ie pb. 
Sea p el número de vectores de base B; para los que A i 3) z EN 
demostrar que el número p es independiente de la base pa i ul bel po 
ue satisface las condiciones establecidas. Sea V* el pia É des a 
bes los vectores de base f; para los que f(B;, Bj) = 1 y a ion E A 
vaina pla lala de lu aa ¿sl 
= di +, de modo que es la unicida ; 
a fácil ver Aoa si œ es un vector no nulo de V*, a 
en otras palabras, f es positivamente definida sobre el cp srd e 
análoga, si x es un vector no nulo de Yo, entonces cai leia se. pe be 
negativamente definida en el subespacio V - Sea aom E ae p OR 
do por los vectores de base fi; para los que /(f;, Pj) = 0. Si a x 
ces f(a, P) = O para todo f en V. i h 
Como ʻai, -- -, Bn} es una base de V, se tiene qu 


Y =V+O0VY-0V.. 
Además, se afirma que si W es cualquier subespacio de Kaen el me vd 
tivamente definida, entonces los subespacios W, V- y V* son pe sor al 
En efecto, supóngase que a está en W, $ en V`, y en V y que a 
Entonces 


0 = fla, a + B + 7) = flara) + fla, B) + fa, Y) 
0 = fB, a +B +7) = SB, a) + SB, B) +$(8, Y). 
Como y está en V+, f(«, y) = /(B, y) = 0; y como f es simétrica, se obtiene 
0 = flo, a) + fla, p) 
0 = f(B, B) + fla, B) 
Luego fla, a) = f(f, B). Como fla, a) > 0 y f(B, B) < O, se sigue que 
Fa, a) = fB, p) = 0. 


i 5 ida sobre V” 
Pero f es positivamente definida sobre W y negativamente a sol 
Se concluye que a = f = 0 y luego también que y = 0. Com 


Vv =VvOvV®Vv: 


i i + es, si 
W, V`, V} son independientes, vemos que dim wW < dim se TE sa 
w E cualquier subespacio de V en el que f es positivamente del y 


i. A a a 
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mensión de W no puede exceder la dimensión de V*. Si G3, es otra base orde- 
nada de V que satisface las condiciones del teorema, se tendrán los correspon- 
dientes subespacios Vý, Vy y Vý; y el razonamiento anterior muestra que 
dim Vř < dim V*. Invirtiéndolo, se obtiene que dim V* < dim V;” y, por 
tanto, 


dim V+ = dim V?. | 


Varios comentarios habría que hacer respecto a la base (8, . . . , Ba} del Teo- 
rema 5 y de los subespacios asociados V+, V7 y V+. Primero obsérvese que 
V* es exactamente el subespacio de los vectores que son «ortogonales» a todos 
los de V. Se observó anteriormente que F+ está contenido en este subespacio; pero 


dim V+ = dim V — (dim V* + dim V7) = dim V — rango f 


de modo que todo vector a tal que f(«, f) = O para todo f debe estar en V+. 
Así que el subespacio V+ es único. Los subespacios V* y V“ no son únicos; 
sin embargo, sus dimensiones son únicas. La demostración del Teorema 5 mues- 
tra que V* es la mayor dimensión posible de cualquier subespacio en el que f 
es positivamente definida. En forma análoga, dim V” es la mayor dimensión 
de cualquier subespacio en el que f es negativamente definida. Por cierto 


dim Y* + dim V“ = rango f. 
El, número 
dim V+ — dim V7 


es a menudo llamado signatura de f. Se le introduce porque las dimensiones 
de V* y Y” están determinadas fácilmente por el rango de f y la signatura de f. 

Debería hacerse tal vez un comentario sobre la relación de las formas bili- 
neales simétricas sobre espacios vectoriales reales con los productos internos. 
Supóngase que V es un espacio vectorial real de dimensión finita y que V,, Va, 
V, sean subespacios de V tales que 


V= VOVO NV. 


Supóngase que fı es un producto interno sobre V, y f, es un producto interno 
sobre V,. Se puede entonces definir una forma bilineal simétrica f sobre V del 
siguiente modo: si a, f son vectores de V, entonces se puede escribir 


0= 0 +0 +0 y  P=PB+B,+P5 
con a;, y pj en Vj. Sea 


Fla, B) = filas, Bi) — falar, Ba). 


El subespacio V+ para f será V3; V, es un adecuado V* para f, y V, es un ade- 
cuado Y”. Una parte de la afirmación del Teorema 5 es que toda forma bilineal 
simétrica sobre V surge de este modo. El resto del contenido del teorema es 
que un producto interno está representado en alguna base ordenada por la 
matriz unidad. 


SAP -— AA q E _ > A. 


> 
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Ejercicios 


1. Las siguientes expresiones definen formas cuadráticas q sobre R?. Hallar la forma 
bilineal simétrica f correspondiente a cada q. 


(a) arī” (e) + 
(b) dbx,22 (f) 3x1te — 2%. 
(c) cxz. (g) 413 + Ozz: — 323. 


(d) 27 — ¿i%e. 
2. Hallar la matriz, en la base ordenada canónica, y el rango de cada una de las formas 
bilincales determinadas en el Ejercicio 1. Indicar cuáles formas son no degeneradas. 


3. Sea q(x,, x2) = ax + bxyx2 + cX la forma cuadrática asociada con una forma bi- 
lineal simétrica f sobre R?. Demostrar que f es no degenerada si, y solo si, b? — 4ac + 0. 


4. Sea V un espacio vectorial de dimensión finita sobre un subcuerpo F de los números 
complejos y sea S el conjunto de todas las formas bilineales simétricas sobre V. 

(a) Demostrar que S es un subespacio de L(V, V, F). 

(b) Hallar dim S. 


Sea Q el conjunto de todas las formas cuadráticas sobre V. 


(c) Demostrar que Q es un subespacio del espacio de todas las funciones de Y E F. 

(d) Describir explícitamente un isomorfismo T de Q sobre S, sin referencia a una base. 

(e) Sea U un operador lineal sobre V y q un elemento de Q. Mostrar que la igualdad 
(UtgMa) = q(Ua) define una forma cuadrática Utg sobre V. e a a r 

(f) Si U es un operador lineal sobre V, demostrar que la función U definida en la 
parte (e) es un operador lineal sobre Q. Demostrar que U t es inversible si, y solo si. U es 
inversible. 


5. Sea q la forma cuadrática sobre R? dada por 
gl&n 29) = az? + 2Zbx122 + cth, a #0. 

Hallar un operador lineal inversible U sobre R? tal que 

(Unz) = at + (6-2) 
(Sugerencia: Para hallar U -1 (y luego U) completar el cuadrado. Para la definición de UT 
véase parte (e) del Ejercicio 4.) 
6. Sea q la forma cuadrática sobre R? dada por 

alar, T2) = 2b21%2 
Hallar un operador lineal inversible U sobre R? tal que 
(Uta, 12) = 26% — 2bx3. 

7. Sea q la forma cuadrática sobre R? dada por 

gls, La, 23) = Xita + Lords + T3. 
Hallar un operador lineal inversible U sobre R? tal que 


(Utg) (2a, Ta, 29) = Ti — 122423. 
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(Sugerencia: Expresar U como producto de operadores análogos a los usados en el Ejer- 
cicio 5 y 6.) 


8. Sea A una matriz simétrica n x n sobre R, y sea q la forma cuadrática sobre R” dada 
por 


Di -. .. Tn) = D As tit;i. 
ij 


Generalizar el método usado en el Ejerċicio 7 para demostrar que existe un operador linea! 
inversible U sobre R” tal que 


(Uta) (Tn ..., Tn) = 2 cia? 
donde c, es 1, —1,00,i=1,...,n. 


9. Sea f una forma bilineal simétrica sobre R”. Usando el resultado del Ejercicio 8. de- 
mostrar que existe una base ordenada @ tal que Dg es diagonal. 


10. Sea V el espacio vectorial real de todas las matrices (complejas) hermíticas 2 x 2, 
esto es, matrices complejas 2 x 2, A, que cumplen A; = Aj. 
(a) Demostrar que la igualdad q(4) = det A define una forma cuadrática q sobre V. 
(b) Sea W el subespacio de V de las matrices de traza 0. Demostrar que la forma bili- 
neal f determinada por q es negativamente definida en el espacio W 


11, Sean V un espacio vectorial de dimensión finita y f una forma bilineal simétrica no 
degenerada sobre Y. Demostrar que, para todo operador lineal 7 sobre V, existe un único 
operador 7” sobre V tal que f(To, p) = fla, T'P) para todo a, 8 de V. Demostrar tam- 
bién que 
(TT) = T314 
(aTi + oT} = aTi + T3 
(TY = T. 


¿Cuánto de lo anterior sigue siendo válido sin la suposición de que T es no degenerada? 


12. Sean F un cuerpo y V el espacio de las matrices n x 1 sobre F. Supóngase que 4 es 
una matriz n x n dada sobre F y que f es la forma bilineal sobre V definida por f(X, Y) = 
X"AY. Supóngase que f es simétrica y no degenerada. Sea B una matriz n x n sobre F y 
T el operador lineal sobre V que aplica X en BX. Hallar el operador 7” del Ejercicio 11. 


13. Sean V un espacio vectorial de dimensión finita y f una forma bilineal simétrica no 
degenerada sobre V. Asociado a f hay un isomorfismo «natural» de V sobre el espacio 
dual V*; este isomorfismo es la transformación Lyp de la Sección 10.1. Usando Ls, demos- 
trar que para cada base @ = (0,,..., a,) de V existe una única base GB = CA y 
de V tal que f(a;, æj) = ôy. Mostrar entonces que para todo vector a de V se tiene que 


a = J f(a, aijai = È flai, ajat. 


14. Sean V, f, @ y @' como en el Ejercicio 13. Supóngase que T es un operador lineal 
sobre V y que 7” es el operador que f' asocia a T como en el Ejercicio 11. Demostrar que 


(a) [7'Jar = [T 
(b) tr (T) = tr (T°) = Zf(Ta;, a). 


a > 
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15. Scan V, f, @ y O como en el Ejercicio 13. Supóngase que L/lg = 4- Demostrar que 
e, = È (Aje; = 2 (A~) nas. 
i j 


16. Sean F un cuerpo y V el espacio de las matrices n x 1 sobre F. Supóngase que A es 
una matriz n x n inversible y simétrica sobre F y que f es la forma bilineal sobre Y detini- 
da por f(X, Y) = X'AY. Sean P una matriz inversible n x n sobre F y G la basa de v que 
consiste en las columnas de P. Hacer ver que la base @' del Ejercicio 13 consta de las co- 
lumnas de la matriz A` '(P'Y '. 
17. Sean V un espacio vectorial de dimensión finita sobre un cuerpo F y f la forma bili- 
neal simétrica sobre V. Para cada subespacio W de V, sea W+ el conjunto de todos los vec- 
tores æ de Y de modo que fía, $} = 0 para todo f de W. Demostrar que 

(a) W+ es un subespacio. 

(b) Y = {0}*. 

(c) V+ = {0} si, y solo he iio no degenerada. 

= — dim 

o e EE is W=m, entonces dim W+ > n — m. (Sugerencia: Sea (Bj,..., 

Pn} una base de W y considérese la aplicación 


a (f(a, Bi), - . - , Sla, Bm) 


de V en F"). ? | 
(f) La restricción de f a W es no degenerada si, y solo si, 


Wnw: = (0). 
(g) V= WOW! si, y solo si, la restriccion de f a W es no degenerada. 
18. Sean V un espacio vectorial de dimensión finita sobre C y f una forma bilincal simé- 


trica no degenerada sobre V. Demostrar que existe una base @ de Y tal que G' = @. (Véase 
Ejercicio 13 para la definición de (B”.) 


10.3. Formas bilineales antisimétricas 


En toda esta sección, V será un espacio vectorial sobre un subcuerpo F del 
cuerpo de los números complejos. Una forma bilineal f en V se llama antisi- 
métrica si f(a, $) = —f(B, «) para todos los vectores A, p de V. Se nd 
un teorema que se refiere a la simplificación de la matriz de una forma bilinea 
antisimétrica sobre un espacio de dimensión finita V. Primero, se harán algunas 
observaciones generales. e 

Supóngase que f es cualquier forma sobre V. Si se hace 

gla, B) = ¿fa, B) + SCE, a)] 
hla, B) = ¿[f(a, B) — £(6, a)] 


entonces es fácil verificar que g es una forma bilineal simétrica sobre V y que 
h es una forma bilineal antisimétrica sobre V. También que f =8g+ h. Además, 
esta expresión de V, como suma de una forma simétrica y una anism 
es única. Así el espacio L(V, V, F) es suma directa del subespacio de las formas 
simétricas y del subespacio de las formas antisimétricas. 


Di AAA A di EA em p A. 
370 http://libreria-universitaria.bl logspot.com 


Algebra lineal 


Si V es de dimensión finita, la forma bilineal f es antisimétrica si, y solo si, 
su matriz A en alguna (o en toda) base ordenada es antisimétrica, 4' = — A. 
Esto se demuestra del mismo modo que se demostró el correspondiente hecho 
respecto a las formas bilincales simétricas. Cuando f es antisimétrica, la matriz 
de f en cualquier base ordenada tendrá todos sus elementos en la diagonal 
iguales a 0. Esto corresponde a la observación de que fla, a) = 0 para todo a 
de V, ya que fla, a) = —f(a, a). 

Supóngase que f es una forma bilineal antisimétrica no nula sobre Y. Como 
SJ + 0, existen vectores a, $ de V tales que fla, $) + 0. Multiplicando a por un 
escalar apropiado, se puede suponer que f(a, $) = 1. Sea y cualquier vector 
del subespacio generado por « y f, por ejemplo, y = ca + df. Entonces 

Kw a) = fica + df, a) = dfíf, a) = —d 
Jr, B) = f(ca + dB, p) = ofla, B) = c 


y así 
(10-7) y = fr, B)a — f(y, JB. 


En particular, obsérvese que « y $ son necesariamente independientes; en efecto, 
si y = 0, entonces f(y, a) = fiy, B) = 0. 

Sea W el espacio bidimensional generado por a y f. Sea W+ el conjunto 
de todos los vectores ô de V tales que f(Ó, a) = f(0. f) = 0; esto es, el conjunto 
de todos los ò tales que f(ô, y) = O para todo y en el subespacio W. Se afirma 
que V = W Q W?. En efecto, sea e cualquier vector de Y y 


Y = f(e, Bja — fle, a)B 
=e- y. 


Entonces y está en W, y ò está en W+, para 


Fô, a) = f(e — f(e, Bla + fle, 08, a) 

= f(e, a) + fle, NA, a) 

=0 
y en forma análoga, /f(ô, p) = 0. Así, pues, todo e de V es de la forma € = y + ô 
con y en W y ó en W+. De (9-7) es claro que W N W+ = (0), y así V = WO W+. 

Ahora la restricción de f a W+ es una forma bilincal antisimétrica sobre W+. 

Esta restricción puede ser la forma cero. Si no es éste el caso, existen vectores 
x' y P" en W! tales que fía”, B) = 1. Si W’ es el subespacio bidimensional 
generado por a” y p’, entonces se tendrá que 


V=WOWOW, 


donde W es el conjunto de todos los vectores ô de W+ tales que f(a', ô) = 
FB", ô) = 0. Si la restricción de f a Wọ no es la forma cero, se pueden elegir 
vectores a”, $” en Wo tales que fla”, 8”) = 1, y se sigue así. 

En el caso de dimensión finita, se obtiene inmediatamente una sucesión 
finita de parejas de vectores 


(as, B1), (az, Ba), - - - , (0%, Bi) 


e €.” a o OOO a A a 
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con las siguientes propiedades: 
(2) ay B)=L j=L...,Kk 
(b) fa. a) = fBi, Bj) = fo, Pi) = 0, i+ j. 
(c) Si W; es el subespacio bidimensional generado por a; y fj, entonces 
V=W0--OWOW 
donde todo vector de W, es «ortogonal» a todos los a; y f;, y la restricción de 
J a Wo es la forma cero. 


Teorema 6. Sea V un espacio vectorial de dimensión n sobre un subcuerpo 
de los números complejos y sea f una forma bilineal antisimétrica sobre V. Enton- 
ces el rango r de f es par, y sir = 2k, existe una base ordenada de V en que la ma- 
triz de f es suma directa de la matriz cero (n — r) x (n — r) y k matrices 2 x 2 


iguales a 
[ 3 ] 
10 


Demostración. Sean %%,, Bi, .-., Ox, Ph los vectores que satisfacen las con- 
diciones anteriores (a), (b) y (c). Sea [y,, ..., Ys} cualquier base ordenada del 
subespacio Wọ. Entonces 


G = {a Bi 02, Be... Qr Bi Yis >>, Ya) 


es una base ordenada de V. Por (a), (b) y (c) es inmediato que la matriz de / en 
la base ordenada @ es suma directa de la matriz cero (n — 2k) x (n — 2k) y 
k matrices 2 x 2 iguales a 


(10-8) rie 


Además, es claro que el rango de esta matriz y, por tanto, el de fes2k. Ẹ 


Una consecuencia de lo anterior es que si f es una forma bilincal antisimé- 
trica no degenerada sobre V, entonces la dimensión de V debe ser par. Si 


dim Y = 2k, existirá una base ordenada [a,, $, -- -, 0%, Bk} de V tal que 
_JS0, 1%j 
Sas, Bi) = (o T 


Flai a;) = Bi, B) = 0. 


La matriz f en esta base ordenada es suma directa de k matrices antisimétricas 
2 x 2 como la (10-8). Se obtiene otra forma canónica para la matriz de una 
forma antisimétrica no degenerada si, en vez de la base ordenada dada anterior- 
mente, se considera la base ordenada 


[or srias 0% Br - 2 Ma 


El lector hallará fácil verificar que la matriz de f en la última base ordenada 
tiene fa forma bloque 
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que «preservan» f. El conjunto de todas las matrices [7] y. donde F es un ope- 
rador lincal que preserva f, será grupo para la multiplicación matricial. Hay 
otra descripción de este grupo de matrices, y es la siguiente. Sea 4 = Lla 
de modo que si a y f son vectores de V con las respectivas matrices de coorde- 
nadas X e Y respecto de @, se tendrá que 


Kla, B) = X'AY. 


Sea T cualquier operador lineal sobre V y M = [7]g. Entonces 


(Ta, TE) = (MX)'A(MY) 
= X'(M'AM)Y. 


Por tanto, T preserva f si, y solo si, M'AM = A. Entonces, en lenguaje matricial, 
el Teorema 7 dice lo siguiente: si A es una matriz n x n inversibie, el conjunto 
de todas las matrices n x n, M, tales que M'AM = A es grupo para la multi- 
plicación matricial. Si 4 = Le entonces M está en este grupo de matrices 
si, y soio si, M = [7]g, donde T es un operador lineal que preserva fi 

Antes de ver algunos ejemplos queremos hacer una observación más. Supón- 
gase que f es una forma bilineal simétrica. Un operador lineal T preserva f 
si, y solo si, T preserva la forma cuadrática 


qla) = fla, a) 
asociada ae f. Si T preserva f, ciertamente tenemos que 
(Ta) = f(Ta, Ta) = fla, a) = g(a) 
para todo a de V. Recíprocamente, como f es simétrica, la identidad de po- 
larización 
Sa, B) = igla + B) — igla — B) 
muestra que T preserva f con tal que q(Ty) = q(y) para todo y de V. (Se está 


suponiendo aquí que el cuerpo escalar es un subcuerpo de los números com- 
plejos.) 


Ejemplo 6. Sea V el espacio R” o C”. Sea f la forma bilineal 
Fla, B) = 2 LY; 
po 


donde a = (x1,..., Xn) y B = (Ya, - - - > Jn). El grupo que preserva f es llamado 
grupo ortogonal (real o complejo) n-dimensional. El nombre de «grupe orto- 
gonal» más corrientemente se aplica al grupo asociado de matrices en la base orde- 
nada canónica. Como la matriz de f en la base canónica es L este grupo consiste 
en las matrices M que cumplen M'M = I. Una matriz asi se llama matriz ortogonal 
n x n (real o compleja). Los dos grupos ortogonales n x n se designan co- 
rrientemente por O(n, R) y O(n, C). Naturalmente, el grupo ortogonal es tam- 
bién el grupo que preserva la forma cuadrática 


Ed) 2H RIA 
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Ejemplo 7. Sea f la forma bilincal simétrica sobre R” con forma cua- 
drática 


Pp j 
q.) = DJ Y e 


Entonces f es no degenerada y tiene signatura 2p — n. El grupo de matrices que 
preservan una forma de este tipo se llama grupo seudoortogonal. Cuando p =n 
se tiene el grupo ortogonal O(n, R) como un tipo particular de grupo seudo- 
ortogonal. Para cada uno de los n + 1 valores p = 0, 1, 2, ..., n se obtienen 
formas bilineales f diferentes; sin embargo, para p = k y p = n — k las formas 
son opuestas una de otra y tienen, pues, el mismo grupo asociado. Así, cuando 
n es impar, se tienen (n + 1)/2 grupos seudoortogonales de matrices n x n, 
y cuando 7 es par tenemos (n + 2)/2 de tales grupos. 


Teorema 8. Sea V un espacio vectorial de dimensión n sobre el cuerpo de 
los números complejos y sea f una forma bilimeal simétrica no degenerada sobre 
V. Entonces el grupo que preserva f es isomorfo al grupo ortogonal comple- 
jo O(n, C). 


Demostración. Por supuesto, un isomorfismo entre dos grupos significa 
correspondencia biunivoca entre sus elementos que «preservan» la operación 
de grupo. Sea G el grupo de los operadores lineales sobre V que preservan la 
forma bilineal f. Como f es simétrica y no degenerada, el Teorema 4 dice que 
existe una base ordenada (B de V en la que f está representada por la matriz 
identidad n x n. Por tanto, un operador lineal T preserva f si, y solo si, su matriz 
en la base ordenada @ es una matriz ortogonal compleja. Luego 


T > [Tle 
es un isomorfismo de G sobre O(n, C). 


Teorema 9. Sea V un espacio vectorial de dimensión n sobre el cuerpo de 
los números reales y sea f una forma bilineal simétrica no degenerada sobre V. 
Entonces el grupo que preserva f es isomorfo a un grupo seudoortogonal n x n. 


Demostración. Repetir la demostración del Teorema 8, usando abora el 
Teorema 5 en vez del 4. J 


Ejemplo 8. Sea f la forma bilineal simétrica sobre R* con la forma cua- 
drática 


glz, Y, z, t) = P — 2? — y? — z. 


Un operador lineal T sobre 'R* que preserva esta forma bilineal (o cuadrática) 
particular, se llama transformación de Lorentz, y el grupo que preserva f se 
llama grupo de Lorentz. He aquí un método para describir algunas transfor- 
maciones de Lorentz. A 

Sea H el espacio vectorial real de las matrices complejas 2 x 2, A, hermíti- 
cas, A = A*. Es de fácil verificación que 
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Wa, y 2,0) = laa e 


y= tx 
define un isomorfismo Dd de R* sobre el espacio H. Por este isomorfismo la 
forma cuadrática q se aplica sobre la función determinante, esto es 


E tez Su 
EEn A acs pa 


qla) = det Pla). 


Lo cual sugiere que se pueden estudiar las transformaciones de Lorentz sobre 
R* estudiando los operadores lineales sobre H que preservan determinantes. 
Sea M una matriz compleja 2 x 2, y para una matriz hermítica A, defínase 


Unm(A) = MAM*. 
Ahora bien, MAM* es también hermítica. Partiendo de esto es fácil ver que 
Uy, es un operador lineal (real) sobre H. Veamos cuándo es cierto que Uy «pre- 
serva» determinantes; es decir, det Uy(4) = det A para toda A de H. Como 


el determinante de M* es el complejo conjugado del determinante de M, se 
ve que 


det [Us(4)] = [det M|? det A. 


Así que Uy preserva determinantes precisamente cuando det M tiene valor 
absoluto 1. 


Así d tomando ahora una matriz compleja 2 x 2, M, para la que 
[det M| = 1, entonces Us, es un operador linea sobre H que preserva deter- 
minantes. Se define 

Tu = Uyt. 
Como Y es un isomorfismo, Ty es un operador lineal sobre R*. También, Ty es 
una transformación de Lorentz; en efecto, 


a(Tra) 


qD Uyda) 
det (dé-UyPa) 
= det (Uyba) 
= det (Pa) 
= qla) 
y de este modo Ty preserva la forma cuadrática q. Utilizando matrices 2 x 2, M, 
específicas, se puede emplear el método anterior para calcular transformaciones 


de Lorentz específicas. Dos comentarios al respecto, que no son dificiles de 
verificar. 


(1) Si M, y M, son matrices 2 x 2, inversibles con elementos comple- 
jos, entonces Uy, = Uy, si, y solo si, M, es un múltiplo escalar de M,. Asi, 
todo lo de las transformaciones de Lorentz vistas anteriormente se puede obte- 
ner de las matrices unimodulares M, esto es, de matrices M que satisfacen 


SS, A A A A C o 
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det M = 1. Si M, y M, son matrices unimodulares tales que M, + M3 y 
M, + — Mhn, entonces Ty, + Ty, 

(2) No toda transformación de Lorentz se puede obtener por el méto- 
do anterior. 


Ejercicios 


I. Sea M un elemento del grupo ortogonal complejo Otn. C). Mostrar que M‘, 
M y M* = M' también pertenecen a O(n, C). 


2. Supóngase que M pertenece a O(n, C) y que M’ es semejante a M. ¿Pertenece M’ tam- 
bién a O(n, C)? 


3. Sea 
n 
Yi= È Mitu 
k=1 


donde M es un elemento de O(n, C). Demostrar que 


Zy =r. 

J 1 
4. Sea M una matriz n x n sobre C” con columnas My, Mz, .... M,. Demostrar que M 
pertenece a O(n, C) si, y solo si, 

MiMx = Ójro 


5. Sea X una matriz n x 1 sobre C. ¿En qué condiciones O(n, C) contiene una matriz 
M cuya primera columna es X? 


6. Hallar una matriz en O(3. C) cuya primera fila es (2i, 2i, 3). 


7. Sean V el espacio de todas las matrices n x 1 sobre C y f la forma bilineal sobre V 
dada por f(X, Y) = X'Y. Sea M perteneciente a O(n, C). ¿Cuál es la matriz de f en la base 
de Y formada por las columnas My, Mz, ..., M, de M? 


8. Sean X una matriz n x 1 sobre C tal que AX = 1 e Y; la j¿ésima columna de la matriz 
unidad. Demostrar que existe una matriz M en O(n, C) tal que MX = 1;. Si X tiene ele- 
mentos reales, mostrar que hay una M en O(n. C) con la propiedad de que MX = 1;. 


9. Sean V el espacio de todas las matrices n x 1 sobre C, A una matriz n x n sobre C y 
f la forma bilineal sobre Y dada por f(X. Y) = X'AY. Demostrar que f es invariante por 
Oin, Cy; es decir, (MX, MY) = f(X, Y) para todo X, Y de V y M en O(n, C) si, y solo si, 
A conmuta con cada elemento de O(n, C). 


10. Sean S cualquier conjunto de matrices n x a sobre C y S” el conjunto de todas las 
matrices n x n sobre C que conmutan con cada elemento de S. Demostrar que S” es un 
álgebra sobre C. 


11. Scan F un subcuerpo de C, V un espacio vectorial de dimensión finita sobre F y f una 
forma bilineal no singular sobre V. Si T es un operador lineal sobre V que preserva f: de- 
mostrar que det T = +1. 


12. Sean F un subcuerpo de C, V el espacio de las matrices n x 1 sobre F, A una matriz 
n x n inversible sobre F y f una forma bilineal sobre V dada por f(X., Y) = X'AY. Si pe es 
una matriz n x n sobre F, demostrar que M preserva f si, y solo si, A 'M'A = M 


13. d Sca g una forma bilincal no singular sobre un espacio vectorial de dimensión finita 
V. Supóngase que Tes un operador lineal inversible sobre Y y que f es. la forma bilineal 
sobre Y dada por fía. $) = gla, 78). Si U es un operador lineal sobre V, hallar condicio- 
nes necesarias y suficientes de U para preservar f. 


l4. Sea T un operador lineal sobre C? que preserva la forma cuadrática x? — x2. Demos- 
trar que 

(a) det (7) = +1. 

bj Si gies la matriz de 7 en la base canónica, entonces Mn = +M, Ma = +M,). 
M?, - M}, =1. xi wei 

(e) Si det M = 1, entonces existe un número complejo no nulo c tal que 


EF ii DE 
M= l 
2 1 
a es 
e 
(d) Si det M = —1, entonces existe un número complejo c tal que 
ESTU, 
1 c c 
M=5 g 
2 1 L 
— +2 —- 
c c. 


I5. Sea f la forma bilineal sobre C? definida por 
K (En 22), (Ys, Ya)) = Tiya — T4- 


Demostrar que 


(a) Si T es un operador lincal sobre C?, entonces f(Tæ, TR) = d 
todo x, f en C?. Aai 


(b) T preserva f si y solo si, det T= +1. 
(c) ¿Qué dice (b) respecto al grupo de matrices 2 x 2, M, tales que M'AM = A, donde 
0 1 
= ? 
A 101 
16. Scan un entero positivo n, Z la matriz unidad n x n sobre C y J la matriz 2n x 2n 


dada por 
OE 
J= ES A} 
Sea M una matriz 2n x 2n sobre C de la forma 
ME 
ma le A 


con A, B, C, D matrices n x n sobre C. Hallar condiciones necesarias y suficientes de A, 
B, C, D para que M'JM = J. 


B) para 


17. Hallar todas las formas bilincales sobre el espacio de las matrices n x 1 sobre R que 
son invariantes por O(n, R). 


18. Hallar todas las formas bilineales sobre el espacio de las matrices n x 1, sobre C que 
son invariantes por O(n, C). 


Apéndice 


Este apéndice se divide lógicamente en dos partes. La primera, que abarca 
las primeras tres secciones, contiene ciertos conceptos fundamentales que apa- 
recen a lo largo del libro (en realidad, a lo largo de la matemática). Es más bien 
una introducción para el libro que un apéndice. La segunda parte es más ge- 
nuinamente un apéndice al texto. 

La Sección 1 contiene un estudio sobre los conjuntos, sus uniones e inter- 
secciones. La Sección 2 analiza el concepto de función y las ideas relacionadas 
de imagen, dominio, función recíproca y restricción de una función a un sub- 
conjunto de su dominio. La Sección 3 trata de las relaciones de equivalencia. 
La materia en estas tres secciones, especialmente la de las Secciones 1 y 2, está 
presentada de modo un tanto conciso. Se trata más bien de un convenio sobre 
terminología que de una exposición detallada. En estricto sentido lógico, este 
material constituye una parte de los requisitos para la lectura del libro; sin 
embargo, el lector no debe descorazonarse si no capta completamente el signi- 
ficado de las ideas en su primera lectura” Estas ideas son importantes, pero al 
lector que no esté del todo familiarizado con ellas le será más fácil absorberlas 
si revisa la exposición de vez en cuando, mientras lee el texto propiamente. 

Las Secciones 4 y 5 se refieren a las relaciones de equivalencia en el contexto 
del álgebra lincal. La Sección 4 contiene un breve estudio de los espacios co- 
cientes. Puede ser leído en cualquier oportunidad, después de los primeros 
dos o tres capítulos del libro. La Sección 5 trata brevemente algunas de las re- 
laciones de equivalencia que se presentan en el libro y pretende mostrar cómo 
algunos de los resultados del libro sc pueden interpretar desde el punto de vista 
de las relaciones de equivalencia. La Sección 6 describe el axioma de elección 
y sus implicaciones para el álgebra lineal. 
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A.l. Conjuntos 


Usaremos las expresiones «conjunto», «clase», «colección» y «familia» in- 
distintamente, aunque damos preferencia a «conjunto». Si S es un conjunto 
y x es un objeto del conjunto S, se dirá que x es un miembro de S, que x es un 
elemento de S, que x pertenece a S o simplemente que x está en S. Si S tiene 
solo un número finito de elementos, x;, ...... x,,. se suele enunciar S disponiendo 
sus elementos entre paréntesis: 


D Mision e 
Así el conjunto S de los enteros positivos de I a 5 será 
S = (1,2,3,4,5). 


Si S y T son conjuntos, diremos que S es un subconjunto de 7 o que S está 
contenido en 7, si todo elemento de S es un elemento de 7. Todo conjunto S es 
subconjunto de sí mismo. Si S es subconjunto de 7, pero S y T no son idénticos, 
diremos que S es subconjunto propio de 7. En otras palabras, S es subconjunto 
propio de T siempre que $ esté contenido en 7, pero T no esté contenido en S. 

Si S y T son conjuntos, la unión de S y T cs el conjunto S$ U T que consta 
de todos los objetos x que son elementos de S o T. La intersección de S y T es 
el conjunto S (A T, que consta de todos los x que son elementos de S y de T. 
Para dos conjuntos cualesquiera, S y T, la intersección S (7 T es un subcon- 
junto de la unión S U T. Esto debe contribuir a aclarar el uso de la palabra «o» 
que prevalecerá en este libro. Cuando se dice que x está en S o en T, no se ex- 
cluye la posibilidad de que x esté en ambos, S y T. 

Para que la intersección de S y T sea siempre un conjunto es necesario que 
se introduzca el conjunto vacío, es decir, el conjunto sin clementos. Entonces 
S N T es el conjunto vacio si, y solo si, S y T no tienen elementos en común. 

A menudo se necesitará considerar la unión o intersección de varios con- 


n 
juntos. Si S,, ..., S, son conjuntos, su unión es el conjunto U S; que consta 
j=1 
de todos los x que son elementos de al menos uno de los conjuntos S4, ..., Sp. 
n 
Su intersección es el conjunto A S; que consta de todos los x que son elementos 
j=1 


de cada uno de los conjuntos S,. -<-> Sp- En unas pocas ocasiones tendremos 
que ver con la unión o intersección de una colección infinita de conjuntos. Debería 
quedar claro cómo tales uniones e intersecciones están definidas. El siguiente 
ejemplo aclarará estas definiciones y una notación para ellas. 


Ejemplo 1. Sea R el conjunto de todos los númcros reales (el eje real). 
Si £ está en R, se asocia con £ un subconjunto S, de R definido de la siguiente 
forma: S, consta de todos los números reales x que no son menores que 7. 

(a) Sa U Sa = S,, donde 1 es el menor entre 1, y ta. 

(b) Sa N Sap = S,, donde 1 es el mayor entre t, y t. 
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(c) Sea Z el intervalo unidad, esto es, el conjunto de todos los t en R 
para los que 0 < f < 1. Entonces 


US = So 
N S= Si. 


tent 


A.2. Funciones 


Una función consta de lo siguiente: 


(1) un conjunto X, llamado dominio de la función; 

(2) un conjunto Y, llamado codominio de la función; 

(3) una relación (o correspondencia) f, que asocia a cada elemento x de 
X un solo elemento f(x) de Y. 


Si (X, Y, f) es una función, se dice también que f es una función de X en le 
Esto no es del todo correcto, ya que no es f quien es la función; f es la ley de 
la función. Sin embargo, este uso del mismo símbolo para la función y su ley 
proporciona un medio mucho más manejable para hablar sobre funciones. mr 
se dirá que f es una función de X en Y, que X es el dominio de Sy ai 
es el codominio de f —todo esto quiere decir que (X, Y, f) es una función como 
se definió anteriormente. Existen otras expresiones que comúnmente se usarán 
en lugar de «función». Algunas de éstas son «transformación», «operador» 
y «aplicación». Tales expresiones se usarán en contextos donde seat e 
piadas en consideración al papel que debe desempeñar una función eun ar. 

Si f es una función de X en Y, el conjunto de imágenes (o imagen) e n es 
el conjunto de todos los f(x), con x de X. En otras palabras, la imagen e f 
consta de todos los elementos y de Y tales que y = fo para algún x de X. Si 
la imagen de f es todo Y, se dirá que f es una función de X sobre Y o smni 
mente que f es sobreyectiva. La imagen de f se representa a menudo por f(X). 


Ejemplo 2. (a) Sca X el conjunto de los números reales y sea Y = Xx. 
Sea f la función de X en Y definida por f(x) = xX. La imagen de f q el cau; 
junto de todos los números reales no negativos. Así que f no es PO yr 

(b) Sea X el plano euclidiano, e Y = X. Definase F; como sigue: si Aes 
un punto del plano, entonces f(P) es el punto obtenido por rotación de P m 
(en torno al origen, en la dirección antirreloj). El recorrido de f es todo Y, es 

ecir, el plano entero, y así f es sobreyectiva. h 

i (©) Sea otra vez Ya plano euclidiano. Se introduce un sistema de coorde- 
nadas en X, como en geometría analítica, por medio de dos rectas perpendicu- 
lares para identificar los puntos de X con pares ordenados (x,, x2) de mino 
reales. Sea Y el eje x,, esto es, todos los puntos (x,, X2) con xz = 0. Si P es un 
punto de X, sea f(P) el punto obtenido al proyectar P sobre el eje xy, parale- 
lamente al eje x7. Es decir, f(x,, x2) = (xı, 0). La imagen de f es todo Y, por 
lo que f es sobreyectiva. 


l 
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(d) Sea X el conjunto de los números reales y sea Y el conjunto de los nú- 
meros reales positivos. Se define una función f de X en Y por f(x) = œ. Enton- 
ces f es una función de X sobre Y. 

(e) Sean X el conjunto de los números reales positivos e Y el conjunto 
de los números reales. Sea f la función logaritmo natural, esto es, la función 
definida por f(x) = log x = In x. Aquí también f es sobreyectiva, es decir, 
todo número real es el logaritmo natural de algún número positivo. 


Supóngase que X, Y y Z sean conjuntos, que f sea una función de X en Y y 
que g sea una función de Y en Z. Existe una función g o f de X en Z asociada 
con f y g, llamada composición de g y f. Está definida por 


(e > PD) = gU1(x)). 


Como un ejemplo simple, sea X = Y = Z el conjunto de los números reales, 
sean f, g, h las funciones de X en Y definidas por 

e=, gqe)=e ha) =e 
y entonces h =.g o f. La composición go f se representa a menudo simple- 
mente por gf; sin embargo, como indica el ejemplo anterior, hay veces en que 
esto se presta a confusiones. 

Un problema de interés es el siguiente. Supóngase que f' es una función 
de X en Y. ¿Cuándo existe una función g de Y en X tal que g(f(x)) = x para todo 
x de Y? Si se representa por / la función identidad en X, esto es, la función de X en 
X definida por I(x) = x, se pregunta: ¿cuándo existe una función g de Y en 
Y tal que g o f = 1? En forma somera, se quiere una función g que «envíe cada 
elemento de Y al sitio de donde proviene». Para que tal función g exista, f debe 
ser evidentemente inyectiva, esto es, f debe tener la propiedad de que si x, + xz, 
entonces f(x,) + f(x>). Si f es inyectiva, tal función g existe. Se la define como 
sigue: sea y un elemento de Y. Si y está en la imagen de f, entonces existe un 
elemento x de X tal que y = f(x); y como f es inyectiva, existe exactamente 
un x con esa propiedad. Se define g(y) = x. Si y no está en la imagen de f se 
define g(y) como cualquier elemento de X. Obviamente tenemos entonces que 
gof=L 

Sea f una función Y en Y. Se dice que f es“inversible si existe una función 
g de Y en Y tal que E 


(1) go f es la función identidad en X, 
(2) fog es la función identidad en Y. es 


Acabamos de ver que si existe una función g que satisface ( 1), entonces f es 
inyectiva. En forma semejante se puede ver que si existe una g que satisface (2), 
la imagen de f es todo Y, es decir, f es sobreyectiva. Así, si f es inversible, f es 
inyectiva y sobreyectiva. Recíprocamente, si f es inyectiva y sobreyectiva, existe 
una función g de Y en X que satisface (1) y (2). Además, esta g es única. Es la 
función de Y en X definida por esta ley; si y está en Y, entonces g(y) es el único 
elemento x en X para el que f(x) = y. 


Si f es inversible (inyectiva y sobreyectiva), la recíproca de f es la función 
única f * de Y en X que cumple: 


(109 FS U0)) = x para cada x en X, 
2) FU” (y) = y para cada y en Y. 


Ejemplo 3. Considérense las funciones del Ejemplo 2. 


(a) Si X = Y, el conjunto de los números reales, y f(x) = x°, entonces 
f no es inversible. En efecto, f no es inyectiva ni sobreyectiva. 

(b) Si ¥ = Y, el plano euclidiano, y f es la «rotación de 90°», entonces 
f es inyectiva y sobreyectiva. La función recíproca f~ ' es la «rotación de — 90°» 
o la «rotación de 270°». 

(c) Si X es el plano, Y el eje x,, y f(x. x2) = (x,, 0), entonces f no es in- 
versible. En efecto, f es sobreyectiva, pero f no es inyectiva. 

(d) Si X es el conjunto de los números reales, Y el conjunto de los núme- 
ros reales positivos y f(x) = e, entonces f es inversible. La función f~! es 
la función logaritmo natural de la parte (e): log e = x, es = y, 

(e) La recíproca de esta función logaritmo natural es la función expo- 
nencial de la parte (d). 


Sea f una función de X en Y y sea fọ una función de Xọ en Yọ. Se dice que 
fo es una restricción de f (o una restricción de f a Xo) si 


(1) Xo es un subconjunto de X, 
(2) f(x) = f(x) para todo x de Xo. 


Por supuesto, que cuando fọ es una restricción de f, se sigue que Y, es un sub- 
conjunto de Y. El nombre de «restricción» viene del hecho de que f y f tienen 
la misma ley, y difieren principalmente porque se ha restringido el dominio 
de definición de la ley a un subconjunto X, de X. 

Si hemos dado la función f y cualquier subconjunto Xy de X. hay una forma 
obvia para construir una restricción de f a Xo. Definimos una función fọ de 
Xo en Y por fo(x) = f(x) para todo x de Xo. Podríamos preguntarnos por qué 
no decimos que esta es la restricción de f a Xo. La razón es que cuando se dis- 
cuten las restricciones de f se desea tener libertad para cambiar el codominio 
Y. al igual que el dominio X. 


Ejemplo 4. (a) Sea X el conjunto de los números reales y f la función 
de X en X definida por f(x) = x°. Entonces f no es una función inversible, 
pero lo es si se restringe su dominio al de los números reales no negativos. Sea 
Xo el conjunto de los números reales no negativos y sea fọ la función de Xp 
en Xo definida por fo(x) = x?. Entonces fọ es una restricción de f a Xo. Pero 
f no es inyectiva ni sobreyectiva. mientras que fọ es inyectiva y sobreyectiva. 
La última afirmación solo dice que todo número no negativo es raíz cuadrada 
de un número no negativo precisamente. La función recíproca fg * es la función 
de Xo en Xo definida por fo '(x) = /x. 

(b) Sea X el conjunto de los números reales y sea f la función de X en X 
definida por f(x) = x? + x? + 1. La imagen de f es todo X y f es sobreyectiva. 
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La lunción / obviamente no es inyectiva. v.gr., /(— 1) = f(0). Pero / es inyec- 
tiva en Xo, conjunto de los números reales no negativos, ya que la derivada 
de f es positiva para x > 0. Cuando x recorre todos los números no negativos. 
f(x) recorre todos los números reales v tales que v > 1. Si se hace que Y, sea 
el conjunto de todos los y > 1 y que fọ sca la función de X, en Yọ. definida 
por folx) = f(x), entonces fọ es una función inyectiva de X, sobre Yọ. Con- 
secuentemente, fọ tiene una función reciproca f, ' de Y, en X¿. Cualquier 
fórmula para f3 '(y) es bastante complicada. 

(c) Sea otra vez X el conjunto de los números reales y sea f la función 
seno, esto es, la función de X en Y definida por f(x) = sen x. La imagen de 
f es el conjunto de todos los y tales que —1 < y < 1: luego f no es sobreyec- 
tiva. Como f(x + 27) = f(x), vemos que f no es inyectiva. Si se hace que Y, 
sea el intervalo —n/2 < x < m/2, entonces f es inyectiva en Xg. Sea Y, el in- 
tervalo —1 < y < ly sea fo la función de X, en Y, definida por f(x) = sen x. 
Entonces fọ es una restricción de f en el intervalo Xo y fo es inyectiva y sobre- 
ycctiva. Esta es otra forma de decir que. en el intervalo de — 7/2 a n 2, la función 
seno toma todo valor entre —1 y 1 exactamente una vez. La función fo ' es 
la función recíproca del seno: 


fo (y) = sen"! y = arc sen y. 


(d) Este es un ejemplo general de restricción de una función. Es un ejem- 
plo mucho más característico de los tipos de restricciones que se usarán en este 
libro, que los anteriores ejemplos (b) y (c). El ejemplo (a) es in caso especial 
de éste. Sea X un conjunto y f una función de X en si mismo. Sea X, un sub- 
conjunto de X. Se dice que X, es invariante por f si para todo x de Xo el elemento 
Fx) está en Xo. Si Xo es invariante por f, entonces f induce una función fọ de 
Xo en sí mismo, por restricción del dominio de su definición a Xo. La impor- 
tancia de la invariancia es que por restricción de f a Xo se puede obtener una 
función de Xo en sí mismo, más bien que simplemente una función de 
Xo en X. 


A.3. Relaciones de equivalencia 


Una relación de equivalencia es un tipo especifico de relación entre pares 
ordenados de elementos en un conjunto. Para definir una relación de equivalen- 
cia debemos ver primero qué se entiende por «relación». 

Ciertamente, una definición formal de «relación» debería comprender re- 
laciones familiares como «x = y», «x < y», «y es la madre de y» y «y es de 
más edad que v». Si X es un conjunto, ¿qué es lo que determina una relación 
entre los pares de elementos de X? Lo que se necesita, evidentemente, es una 
ley para determinar si. para dos elementos dados cualesquiera x e v de X, y 
está o no en la correspondencia dada con v. Esa ley R se la llama una relación 
(binaria) en X. Si queremos ser más precisos se puede proceder como sigue. 
Sea X x X el conjunto de todos los pares ordenados (x, 1) de elementos en X. 


Una relación binaria en Y es una función R de X x X en el conjunto (0, 1}. 
Esto es, R asigna a cada par ordenado (x, y) el valor 1 o 0. La idea es que si 
R(x, v) = 1. entonces x está en la correspondencia dada con y, y si R(x, y) = 0, 
no lo está. 

Si R es una relación binaria en el conjunto X es conveniente escribir xRy 
cuando R(x, y) = 1. Una relación binaria R se dice 


(1) reflexiva, si xRx para todo x de X; 
(2) simétrica, si vRx toda vez que xRy; 
(3) transitiva, si xRz toda vez que xRy y yRz. 


Una relación de equivalencia en X es una relación binaria en X que es reflexiva, 
simétrica y transitiva. 


Ejemplo 5. (a) En cualquier conjunto la igualdad es una relación de equi- 
valencia. En otras palabras, si xRy quiere decir x = v, entonces R es una re- 
lación de equivalencia. En efecto, x = x, si x = y entonces y = x, si x= y 
e y = z entonces x = z. La relación «x + y» es simétrica, pero no es reflexiva 
ni transitiva. 

(b) Sea X el conjunto de los números reales y supóngase que xRy quiere 
decir x < y. Entonces R no es una relación de equivalencia: es transitiva, pero 
no es reflexiva ni simétrica. La relación «x < y» es reflexiva y transitiva, pero 
no es simétrica. 

(c) Sea E el plano euclidiano y sea X el conjunto de todos los triángulos 
del plano E. Entonces la congruencia es una relación de equivalencia en X; 
esto es, «T, = T,» (T, es congruente con 7,) es una relación de equivalencia 
en el conjunto de todos los triángulos en el plano. 

(d) Sea X el conjunto de todos los enteros 


TO OD NA 


Sea n un entero positivo fijo. Se define una relación R, en X por: xR,,y si, y solo si, 
(x — y) es divisible por n. La relación R, se llama congruencia módulo n. En 
vez de xR,y es corriente escribir 


x= y. mód n (x es congruente a y módulo n) 


cuando (x — v) es divisible por n. Para cada entero positivo n, la congruencia 
módulo » es una relación de equivalencia en el conjunto de los enteros. 

(e) Sean X e Y conjuntos y f una función de X en Y. Se define una rela- 
ción R en X por: x, Rx, si, y solo si, f(x,) = f(x2). Es fácil verificar que R es 
una relación de equivalencia en el conjunto X. Como se verá, este ejemplo par- 
ticular comprende en realidad todas las relaciones de equivalencia. 

Supóngase que R vs una relación de equivalencia en el conjunto X. Si x 
es el elemento de X. Etx; R) representa el conjunto de todos los elementos y 
de X tales que xRy. Este conjunto E(x; R) se llama la clase de equivalencia de 
x (para la relación de equivalencia R). Como R es una relación de equivalencia, 
tas clases de equivalencia tienen las siguientes propiedades: 
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(1) Todo E(x; R) es no vacio; en efecto, como vRx, el elemento x perte- 
nece a E(x; R). 

(2) Sean x e y elementos de X. Como R es simétrica, y pertenece a E(x: R) 
si, y solo si, x pertenece a E(y; R). 

(3) Si xey son elementos de X, las clases de equivalencia E(x; R) y E(x; R} 
o son idénticas o no tienen elementos en común. Primero supóngase que xRp. 
Sea z cualquier elemento de E(x; R), es decir, un elemento de Y tal que xR-. 
Como R es simétrica, se tiene que zRx. Por hipótesis, xRy, y puesto que R es 
transitiva, se tiene zRy o yRz. Esto muestra que todo elemento de E(x; R) es 
elemento de E(y; R). Por la simetría de R, del mismo modo podemos ver que 
todo elemento de E(y; R) es elemento de E(x; R); luego E(x; R) = E{y: R). 
Ahora bien, se afirma que si la relación xRy no es válida, entonces E(x; R) A 
Ely; R) es vacio. En efecto, si z está en ambas de estas clases de equivalencia 
tenemos que xRz e yRz, o sea xRz y zRy, luego xRy. 


Si $ representa una familia de clases de equivalencia para la relación de 
equivalencia R, vemos que: (1) todo conjunto de la familia $ es no vacío, (2) todo 
elemento x de X pertenece a uno, y solo uno, de los conjuntos de la familia $, 
(3) xRy si, y solo si, x e y pertenecen al mismo conjunto en la familia $. En re- 
sumen, la relación de equivalencia R subdivide a X en la unión de una familia 
de subconjuntos (no vacios) que no se solapan. El razonamiento es también 
válido a la inversa. Supóngase que $ es una familia de subconjuntos de X que 
satisfacen las condiciones (1) y (2) anteriores. Si se define una relación R por (3), 
entonces R es una relación de equivalencia sobre X y $ es la familia de clases de 
equivalencia segun R. 


Ejemplo 6. Veamos cuáles son las clases de equivalencia según las rela- 
ciones de equivalencia en el Eiemplo 5. 


(a) Si R es la igualdad en el conjunto X. entonces la clase de equivalencia 
del elemento x es simplemente el conjunto {x}, cuyo único elemento es x. 
~ (b) Si X es el conjunto de todos los triángulos en el plano y R es la relación 
de congruencia, todo lo que se puede decir en principio es que la clase de equiva- 
lencia del triángulo T consta de todos los triángulos que son congruentes con T. 
Uno de los objetivos de la gcometría plana es dar otras descripciones de estas 
clases de equivalencia. 

(c) Si X es el conjunto de los enteros y R, es la relación «congruencia mó- 
dulo n», entonces hay precisamente n clases de equivalencia. Cada entero x se 
puede expresar univocamente en la forma x = qn + r, donde q y r son enteros 
y0<r<n-— 1. Esto muestra que cada x es congruente módulo n a uno pre- 


cisamente de los n enteros 0, 1, 2, ..., n — 1. Las clases de equivalencia son 
Eo= 4. .., —2n, —n, 0, 1, 2n, .. .) 


il 


L..,1-=2n,1>-8n1+m2n,1+2%n,...) 


Ena LL 1-2n,n—1-—na,n 1a—1+m, 
n—-1+2%,...). 


(d) Supóngase que X e Y son conjuntos, f una función de X en Y y Res 
la relación de equivalencia definida por x,Rx, si, y solo si f(x,) = f(x2). Las 
clases de equivalencia según R son los mayores subconjuntos de X en los que f 
es «constante». Otra descripción de las clases de equivalencia es ésta: están en 
correspondencia biunivoca con los elementos de la imagen de f. Si y está en la 
imagen de f, el conjunto de todos los x de X tales que f(x) = y es una clase de 
equivalencia según R; y esto define una correspondencia biunívoca entre los 
elementos de la imagen de f y las clases de equivalencia de R. 

Un comentario más respecto a las relaciones de equivalencia. Dada una 
relación de equivalencia en X, sea $ la familia de las clases de equivalencia 
según R. La asociación de la clase de equivalencia E(x; R) con el elemento x 
define una función f de X en $ (en realidad, sobre $): 


Mx) = Elx; R). 


Esto muestra que R es la relación de equivalencia asociada a una función cuyo 
dominio es X, como en el Ejemplo 5(e). Lo que esto indica es que toda relación 
de equivalencia en el conjunto X está determinada como sigue: Se tiene una 
ley (función) f que asocia a cada elemento x de X un objeto f(x), y xRy si, y solo 
si f(x) = f(v). Ahora debe pensarse en f(x) como una propiedad de x, de modo 
que lo que la relación de equivalencia hace (someramente hablando) es reunir 
a todos aquellos elementos de X que tienen esta propiedad en común. Si el ob- 
jeto f(x) es la clase de equivalencia de x, entonces todo lo qu^ se ha dicho es 
que la propiedad común de los elementos de una clase de equivalencia es que 
pertenecen a la misma clase. Claro es que esto no dice mucho. Por lo general, 
hay muchas funciones diferentes, f, que determinan, cómo se hace antes, 
la relación de equivalencia dada, y un objetivo en el estudio de las relaciones 
de equivalencia es hallar una f tal que dé una descripción elemental y con sen- 
tido de la relación de equivalencia. En la Sección A.5 veremos cómo se hace 
esto para algunas relaciones de equivalencia especiales que aparecen en el álge- 
bra lineal. 


A.4. Espacios cocientes 


Sea V un espacio vectorial sobre el cuerpo F y sea W un subespacio de V. 
Hay en general muchos subespacios W” que son complementarios de W, es 
decir, subespacios con la propiedad de que V = W @ W’. Si tenemos un pro- 
ducto interior sobre V, y W es de dimensión finita, hay un subespacio particular 
que se podría llamar, probablemente, subespacio complementario «natural» 
de W. Este es el complemento ortogonal de W. Pero si V no tiene otra estructura 
fuera de su estructura de espacio vectorial, no hay modo de seleccionar un sub- 
espacio W’ que se pudiera llamar subespacio complementario natural de W. 
Sin embargo, se puede construir a partir de V y W un espacio vectorial V/W, 
llamado «cociente» de V y W, que hará de complemento natural de W; Este 
espacio cociente no es un subespacio de V y, por tanto, no puede ser un subes- 
pacio complementario de W; pero es un espacio vectorial definido solo en tér- 
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minos de V y W y tiene la propiedad de que es isomorfo. a cualquier subespacio 
W’ que sea complementario de W. 

Sea W un subespacio de un espacio vectorial V. Si a y f} son vectores en V, 
se dice que a es congruente con } módulo W si el vector (x — f) está en el subes- 
pacio W. Si a es congruente con $ módulo W, se escribirá 


a=B, mód W. 
Ahora bien, la congruencia módulo W es una relación de equivalencia sobre V. 


(1) a =«, mód W, pues a — a = 0 está en W. 

(2) Si a = f, mód W, entonces f = «a, mód W. En efecto, como W es 
un subespacio de V, el vector (a — ß) está en W si, y solo si, ($ — a) está en W. 

(3) Sia = fi, mód W y ß = y, mód W, entonces « = y, mód W. En efec- 
to, si (x — P) y (B — y) están en W, entonces a — y = (x — f) + (B — y) 
está en W. 


Las clases de equivalencia de esta relación de equivalencia se llaman clases 
laterales de W. ¿Cuál es la clase de equivalencia (clase lateral) de un vector a? 
Consta de todos los vectores f de V tales que (8 — a) está en W; esto es, todos 
los vectores f de la forma $ = a + y, con y en W. Por esta razón la clase lateral 
del vector a se representa por 


a+ Ww. 


Es apropiado pensar que la clase lateral de a con respecto a W es el conjunto 
de los vectores que se obtienen por traslación del subespacio W por el vector a. 
Para ilustrar estas clases laterales, el lector podría pensar en el siguiente caso 
especial. Sea V el espacio R? y sea W un subespacio unidimensional de V. Si 
se considera V como un plano euclidiano, W es una recta por el origen. Si a. = 
(xı, x2) es un vector en V, la clase lateral a + W es la recta que pasa por el punto 
(xı, X2) y es paralela a W. 

La colección de todas las clases laterales de W se representará por V/W. 
Definimos ahora una adición vectorial y una multiplicación por un escalar 
en V/W como sigue: 


(a + W) + (8 +W) = (a + 8) + W 
cla +W) = (ca) + W. 


En otras palabras, la suma de la clase lateral de a y la clase lateral de $ es la clase 
lateral de (a + £f) y el producto del escalar c y de la clase lateral de a es la clase 
lateral del vector ca. Ahora bien, muchos vectores diferentes de V tendrán la 
misma clase lateral con respecto a W y, por tanto, se debe verificar que la suma 
y el producto anterior dependen solo de las clases laterales que intervienen. 
Lo que esto quiere decir es que debemos demostrar lo siguiente: 


(a) Si a = a”, mód W y ß = f', mód W, entonces 


a+f=0a +8, mód W. 


(2) Si a = a, mód W, entonces ca = ca”, mód W. 


Estos hechos son fáciles de verificar. (1) Si a — a está en W y $ — f' está 
en W, entonces como (a + p) — (a' + $’) = (a — a') + (B — P’), vemos que 
2 + f es congruente con a' + 8’ módulo W. (2) Si a — a' está en W y c cual- 
quier escalar, entonces ca — ca' = c(a — a) está en W. 

Es ahora fácil de verificar que V/W, con la adición vectorial y la multipli- 
cación por escalares definidos anteriormente, es un espacio vectorial sobre el 
cuerpo F. Debemos comprobar directamente cada uno de los axiomas para un 
espacio vectorial. Cada una de las propiedades de la adición vectorial y de la 
multiplicación por escalares se desprenden de la correspondiente propiedad 
de las operaciones en V. Habría que decir que el vector nulo de V/W será la 
clase lateral del vector nulo de V. Es decir, W es el vector nulo de V/W. 

El espacio vectorial V/W se llama cociente (o diferencia) de Y y W. Hay 
una transformación lineal natural Q de V sobre V/W. Está definida por QO(a) = 
a + W. Debemos notar que se han definido las operaciones en V/W justamente 
para que esta transformación Q sea lineal. Obsérvese que el espacio nulo de Q 
es exactamente el subespacio W. Se llama a Q la transformación cociente (o 
aplicación cociente) de V sobre V/W. 

La relación entre el espacio cociente V/W y los subespacios de Y que gon 
complementarios de W puede ser ahora establecida como sigue.* A 

ransfor- 


Teorema. Sea W un subespacio del espacio vectorial V y sea Q la 
mación cociente de V sobre V/W. Supóngase que W' es un subespacio de V. Enton- 
ces V = WOQ W si, y solo si, la restricción de O a W' es un isomorfismo de W' 
sobre V/W. s 


Demostración. Supóngase que V = W @ W”. Esto quiere decir que cada 
vector a de V está univocamente expresado en la forma a = y + y”, con y en W 
y y' en W”. Entonces Qa = Qy + Oy” = Qy”, esto es, a + W = y" + W. Esto 
muestra que O aplica W’ sobre V/W, es decir, que Q(W”) = V/W. También 
Q es inyectiva en W”; en efecto, supóngase que y; y yz sean vectores en W' y 
que Oy; = Qy}. Entonces Q(y; — y2) = 0, con lo que y; — y, están en W. 
Este vector está también en W”, que es disjunto de W;/luego y, — y, = 0. La 
restricción de Q:a W” es, por tanto, una transformación lineal inyectiva de W’ 
sobre V/W. i 

Supóngase que W” es un subespacio de V tal que O sea inyectiva en W” y 
que Q(W) = V/W. Sea a un vector de V. Entonces existe un vector y” de W' 
tal que Qy’ = Qg; es decir, y" + W = a + W. Esto quiere decir que a = y + y” 
para algún vector y en W. Por tanto, V = W + W”. Para ver que W y W' son 
disjuntos, supóngase que y está en W y W'. Como y está en W, se tiene Oy = 0. 
Pero Q es inyectiva en W’, y entonces debemos tener que y = 0 Por tanto, 
tenemos que V= WOW. | 


Lo que realmente dice este teorema es que W’ es complementario de W si, 
y solo si, W’ es un subespacio que contiene exactamente un elemento de cada 
clase lateral de W. Muestra que cuando V = W GQ W’, la transformación 
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cociente Q «identifica» W’ con V/W. En resumen, (W O W')/W es isomorfo 
de W’ de un modo «natural». 

Otro hecho obvio debemos notar. Si W es un subespacio del espacio vec- 
torial de dimensión finita V, entonces 


dim W + dim (V/W) = dim V. 


Se puede ver esto del teorema anterior. Tal vez es más fácil observar que lo que 
esta fórmula dimensional dice es que 


nulidad (O) + rango (Q) = dim V. 


No es nuestro propósito hacer aquí un tratamiento detallado de los espa- 
cios cocientes. Pero hay un resultado fundamental que se demostrará. 


Teorema, Sean V y Z espacios vectoriales sobre el cuerpo F. Supóngase 
que T es una transformación lineal de V sobre Z. Si W es el espacio nulo de T, 
entonces Z es isomorfo a V/W. 


Demostración. Definimos una transformación U de V/W en Z por 
U(a + W) = Ta. Debemos verificar que U está bien definida, es decir, que 
sia + W = f + W, entonces Ta = Tf. Esto se desprende del hecho de que 
W es el espacio nulo de T; en efecto, a + W = $ + W quiere decir que a — f 
está en W, y esto sucede si, y solo si, T(x — fB) = 0. Esto muestra no solo que 
U está definida, sino que también U es inyectiva. 

Es ahora fácil comprobar que U es lineal y aplica V/W sobre Z, pues T es 
una transformación lineal de V sobre Z. f 


A.5. Relaciones de equivalencia 
en Algebra Lineal 


Consideraremos algunas de las relaciones de equivalencia que aparecen 
en el texto de este libro. Este es apenas una muestra de tales relaciones. 


(1) Sean m y n enteros positivos y F un cuerpo. Sea X el conjunto de todas 
las matrices m x n sobre F. Entonces la equivalencia por filas es una relación 
de equivalencia en el conjunto X. La afirmación «4 es equivalente por filas 
a B» quiere decir que A se puede obtener de B por una sucesión finita de ope- 
raciones elementales por filas. Si escribimos A ~ B por «A es equivalente por 
fila a B», entonces no es dificil comprobar las propiedades (i) 4 ~ A; (ii) si 
A ~ B, entonces B ~ A; (iii) si A ~ B y B ~ C, entonces A ~ C. ¿Qué se 
sabe de esta relación de equivalencia? En realidad se sabe mucho. Por ejem- 
plo, se sabe que A ~ B si, y solo si, A = PB para cierta matriz inversible m x m, P; 
o A ~ B si, y solo si, el sistema homogéneo de ecuaciones lineales AX = 0 
y BX = 0 tienen las mismas soluciones. También se tiene información explícita 
respecto a las clases de equivalencia para esta relacion. Cada matriz m x n, A, 
es equivalente por filas a una, y solamente una, matriz escalón reducida por 
filas. Lo que esto dice es que cada clase de equivalencia, según esta relación, 


ba yg AAA € Dit. aa 
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contiene precisamente una matriz escalón reducida por filas, R; la clase de 
equivalencia determinada por R consta de todas las matrices A = PR donde 
P es una matriz inversible m x m. También se puede pensar en esta descripción 
de las clases de equivalencia del siguiente modo. Dada una matriz m x n, A, 
tenemos una ley (función) f que asocia con A la matriz escalón reducida por 
filas f(4) que es equivalente por filas a A. La equivalencia por filas está comple- 
tamente determinada por f. En efecto, A ~ B si, y solo si, f(4) = /(B), es 
decir, si, y solo si, A y B tienen la misma forma escalón reducida por filas. 

(2) Sea n un entero positivo y F un cuerpo. Sea X el conjunto de todas las 
matrices n x n sobre F. Entonces la semejanza es una relación de equivalencia 
en X; toda matriz.n. x n, A, es semejante a sí misma; si A es semejante a B, 
entonces B es semejante a A; si A es semejante a B y B es semejante a C, enton- 
ces A es semejante a C. Sabemos también bastante de esta relación de equi- 
valencia. Por ejemplo, A es semejante a B si, y solo si, A y B representan el mismo 
operador lineal sobre F” en (posiblemente) diferentes bases ordenadas. Pero 
se sabe algo más profundo que esto. Toda matriz n x n, A, sobre F es semejante 
(sobre F) a una, y solo a una, matriz que está en la forma racional (Capítulo 7). 
En otras palabras, cada clase de equivalencia, según la relación de semejanza, 
contiene precisamente una matriz que está en la forma racional. Una matriz 
en la forma racional está determinada por un k-tuple (p,, ...., pa) de polino- 
mios mónicos que tienen la propiedad de que p;+1 divide a p,,j=1,...,k—1. 
Así, se tiene una función f que asocia a cada matriz n x n, A, un k-tuple f(4) = 
(Ps, - . ., Pk) que satisface la condición de divisibilidad de que Pj+1 divide a pj. 
Y, A y B son semejantes si, y solo si, f(4) = f(B). 

(3) He aquí un caso especial del anterior Ejemplo 2. Sea X el conjunto 
de las matrices 3 x 3 sobre el cuerpo F. Se considera la relación de semejanza 
en X. Si A y B son matrices 3 x 3 sobre F, entonces A y B son semejantes si, y 
solo si, tienen el mismo polinomio característico y el mismo polinomio minimal. 
Asociado a cada matriz 3 x 3, A, se tiene un par de polinomios mónicos (p, q) 
que satisfacen 


(a) grd f = 3; 
(b) p divide f; 


siendo f el polinomio característico para A y p el polinomio minimal para A. 
Dados los polinomios mónicos f y p sobre F, que cumplen (a) y (b), es fácil 
encontrar una matriz 3 x 3 sobre F que tiene a f y a p como sus polinomios 
característico y minimal, respectivamente. Lo que todo esto significa es que: 
Si se considera la relación de semejanza en el conjunto de las matrices 3 x 3 


sobre F, las clases de equivalencia están en correspondencia biunívoca con los 
pares ordenados (/, p) de polinomios mónicos sobre F que satisfacen (a) y (b). 


A.6. El axioma de elección 


Someramente hablando, el axioma de elección es una regla (o principio) 
del pensamiento que dice que, dada una familia de conjuntos no vacios, se 


E 


puede elegir un elemento de cada conjunto. Para ser más precisos, supóngase 
que se tenga un conjunto de índices A y que para cada a de A se tenga un conjunto 
asociado S, no vacío. El «elegir» o «seleccionar» un elemento de cada S, quiere 
decir dar una regla f que asocie a cada a un elemento f(a) en el conjunto S,. 
El axioma de elección dice que esto es posible; es decir, dada la familia de con- 
juntos (S,), existe una función f de A en 


U Sa 


tal que f(x) está en S, para todo a. Este principio es aceptado por la mayoría 
de los matemáticos, pese a que surgen muchas situaciones en las que está lejos 
de ser claro cómo se pueda hallar una función explícita f. 

El axioma de elección tiene consecuencias sorprendentes. La mayoría de 
las cuales tienen poca o ninguna influencia en el material de este libro; sin em- 
bargo, es digna de mencionar una: todo espacio vectorial tiene una base. Por 
ejemplo, el cuerpo de los números reales tiene una base, considerado como 
espacio vectorial sobre el cuerpo de los racionales. Es decir, existe un subconjun- 
to S de R que es linealmente independiente sobre el cuerpo de los racionales 
y tiene la propiedad de que cada número real es una combinación lineal racional 
de un número finito de elementos de S. No nos detendremos aquí a derivar 
este espacio vectorial que resulta de la aplicación del axioma de elección. Para 
una demostración, el lector puede consultar el libro de Kelley citado en la bi- 
bliografía, 
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coordenadas, 51 
de la forma bilineal, 356 
de la transformación lineal, 86, 87 
de una forma, 318 
de Vandermonde, 123 
del producto interno, 272 
elemental, 19, 251 
elemental de Jordan, 244 
escalón reducida por filas, 11, 56 
factores invariantes de la, 238, 259 
forma de Jordan de la, 245 
forma racional de la, 237 
inversa de la, 21, 158 
inversible, 21, 158 
nilpotente, 243 
normal, 312 
nula, 12 
ortogonal (Ej. 4), 161, 374 
polinomio minimal de la, 190 
positiva, 325 
producto de, 17, 89 
rango de la, 113 
rango de fila de la, 56, 72, 113 
reducida por filas, 9 
semejante, 93 
simétrica, 35, 209 
transpuesta de la, 113 
traza de la, 97. 
triangular, 154 
triangular superior, 27 
unidad, 9 
unitaria (Ej. 5), 161, 300 
Máximo común divisor (m.c.d.), 132 
Mínimal, polinomio, 190 
Módulo, 162 
base para el, 163 
dual, 164 
finitamente generado, 163 
libre. 163 
rango del, 163 
Mónico, polinomio, 119 
Movimiento rígido (Ej. 14), 307 
Multilineal, función (forma). 164-65 
grado de la, 164 
Multiplicidad, 129 


Nilpotente: 
matriz, 243 
operador, 221 
n-lineal, función, 141 
alternada, 143, 168 
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No degenerada: 
forma (Ej. 6), 320 
forma bilineal, 359 
No negativa: 
forma, 321 
operador, 325, 337 
No singular: 
forma (véase No degenerada) 
transformación lineal, 79 
Norma, 271 
Normal: 
forma, 256, 259 
matriz, 312 
operador, 309 
n-tuple, 29 
Nulidad de la transformación lineal, 71 
Nulo, espacio, 71 
Números: 
complejos, 2 
racionales, 3 
reales, 2 


Operador semisimple, 260 
Operador lineal, 76 
Ordenada, base, 50 
Ortogonal: 

complemento, 282 

conjunto, 276 

equivalencia, 305 

grupo, 374 

matriz (Ej. 4), 161, 374 

proyección, 283 

transformación lineal, 301 
Ortogonales, vectores, 276, 362 
Ortonormal: 

base, 279 

conjunto, 276 


Paralelogramo, ley del (Ej. 9), 273 
Permutación, 150 

impar, par, 151 

producto de, 152 

signo de una, 151 
Polar, descomposición, 338 
Polarización, identidad de, 272, 362 
Polinomio, 116 

característico, 182 

cero del, 127 

coeficientes del, 119 

derivado del, 127, 264 

descomposición prima del, 135 

escalar, 119 

factorización prima del, 135 

función, 30 

grado del. 118 

irreducible (primo), 133 


mo a Y 


mp me. 
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Polinomio: 
minimal, 190 
mónico, 119 
primo (irreducible), 133 
raíz del, 127 
reducible, 133 
Positiva, matriz, 325 
Positivo: 
entero, 2 
forma, 321, 324 
operador, 325 
Positivamente definido, 362 
Potencias formales, serie de, 118 
Prima, descomposición: 
de polinomios, 135 
teorema de la, 219 
Prima, factorización de polinomios, 135 
Primo: 
polinomio, 133 
relativo, 131 
Primos, componentes, 346 
Principal: 
ideal, 130 
teorema del eje, 319 
Principales, menores, 322 
Proceso de ortogonalización, 278. 285 
Producto: 
de transformaciones lineales, 75 
de matrices, 14, 89 
de permutaciones, 155 
exterior, 174, 176 
tensorial, 166 
Producto exterior, 174, 176 
Producto interno, 269 
canónico, 269, 270 
espacio con, 274 
forma cuadrática del, 271 
matriz del, 272 
Propio, subespacio, 381 
Proyección, 209 
ortogonal, 283 


Racional, forma, 237 
Raíz: 
de polinomios, 127 
de una familia de operadores, 338 
Raíz cuadrada, 336 
Rango: 
de fila, 56, 72, 113 
de columna, 72, 113 
de la forma bilineal, 359 
de la matriz, 113 
de la transformación lineal, 71 
del módulo, 163 
determinante (Ej. 9), 162 
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Reducible, polinomio. 133 
Relación, 385 
Resolución: 
de la identidad, 332, 339 
espectral, 331, 340 
Restricción: 
de una función, 383 
operador, 198 
Rotación (Ej. 4), 54, 306 


Semejantes, matrices, 93 
Semisimple, operador, 260 
Separador, vector (Ej. 14), 242 
Serie de potencia, 118 
Sesquilineal, forma, 316 
Sigpatura, 366 
Signo de una permutación, 151 
Simétrica: 
forma bilineal, 361 
grupo, 152 
matriz, 35, 209 
Simultánea, 
diagonalización, 205 
triangulización, 205 
Sistema de ecuaciones lineales, 3 
homogéneas, 3 
Subconjunto, 381 
invariante, 385 
propio, 381 
Subcuerpo, 2 
Subespacio, 34 
anulador de un, 100 
cíclico, 226 
cociente, 390 
complementario, 230 
complementario ortogonal, 282 
generado, 36 
independiente, 208 
invariante, 197, 205, 310 
nulo, 35 
T-admisible, 231 
Subespacios, suma de, 37 
Sucesión de vectores, 47 
Submatriz (Ej. 9), 162 
Suma: 
de subespacios, 37 
directa, 209 


T-admisible, subespacio, 231 
T-anulador, 200, 201, 227 
T-conductor, 200, 201, 231 
Taylor, fórmula de, 128, 264 
Tensorial, producto, 166 
Teorema fundamental del álgebra, 136 
Transformación: 

cero, 67 


Transformación: ' 
de derivación, 67 

Transformación (operador) lineal, 67, 76 
adjunta, 292 
autoadjunta, 295, 310 
cociente, 389-90 
descomposición cíclica de la, 232 
descomposición polar de la, 338 
determinante de la, 171 
diagonalizable, 183 
imagen por la, 71 
invertible, 79 
matriz de la, 87, 88 
matriz de la, en la base normal, 291 
nilpotente, 220 
no negativa, 325, 336 
no singular, 79 
normal, 309 
nulidad de la, 71 
ortogonal, 301 
parte diagonalizable de la, 220 
polinomio minimal de la, 190 
positiva, 324 
rango de la, 71 
semisimple, 261 
transpuesta de la, 111 
triangulable, 201, 312 


Transformación lineal, 
traza de la (Ej. 15), 106 
unitaria, 299 
Transpuesta: 
conjugada, 270 
de la matriz, 113 
de la transformación lineal, 111 
Traza: *- 
de la matriz, 97 
de la transformación lineal (Ej. 15), 106 


Triangulable, transformación lineal, 201, 312 


Triangular, matriz (Ej. 7), 154 
Triangulación, 205 


Unión, 334 

Unitaria: 
diagonalización, 313 
equivalencia, 305, 351 
matriz (Ej. 5), 161, 300 
transformación, 351 

Unitario: 
espacio, 275 
operador, 299 


Vandermonde, matriz de, 123 
Valor propio, 181, 182 
Vector propio, 181 
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